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(57) Abstract: The invention relates to a method for analyzing nucleic acid se- 
quences and gene expression. The method is based on the detection of fluores- 
cence signals of nucleotide molecules inserted into growing nucleic acid chains 
by means of a polymerase. The reaction occurs on a plane surface, wherein a plu- 
rality of individual nucleic acid molecules are immobilized on said surface. All 
said nucleic acid molecules are exposed to the same conditions so that a build-up 
reaction can simultaneously take place in all nucleic acid molecules. 

(57) Zusammenfassung: Die Erfindung betrifft ein Verfahren zur Analyse von 
Nukleinsaurekettensequenzen und der Genexpression. Grundlage der Methode 
ist die Detektion von Fluoreszenzsignalen einzelncr, mit Farbstoffen markierter 
Nukleotidmolekule, die durch eine Polymerase in wachsende Nukleinsaureketlen 
eingebaut werden. Die Reaktion verlSuft auf einer planen Oberflache. Auf dieser 
Oberflache sind viele einzelne Nukleinsaure-Molekule immobilisiert. Alle diese 
Nukleinsaure-Molekule sind gleichen Bedingungen ausgesetzt, so dass an alien 
Nukleinsaure-Molekiilen gleichzeitig eine Aufbaureaktion ablaufen kann. 
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Verfahren zur Analyse von Nukleinsaurekettensequenzen und der 
Genexpr e s s i on 

Die Erfindung betrifft ein Verfahren zur Analyse von 
Nukleinsaureketten und der Genexpression. Die Grundlage der 
Methode ist die Detektion von Fluoreszenzsignalen einzelner 
mit Farbstoffen markierter Nukleotidmolekule, die durch eine 
Polymerase in eine wachsende Nukleinsaurekette eingebaut 
werden. Die Reaktion verlauft auf einer planen Oberflache. An 
diese Oberflache sind viele einzelne Nukleinsaure-Molekiile 
gebunden. Alle diese Nukleinsaure-Molekiile sind gleichen 
Bedingungen ausgesetzt, so dass an alien Nukleinsaure- 
Molekiilen gleichzeitig eine Aufbaureaktion ablaufen kann. 

Das Verfahren umfafit im wesentlichen folgende Schritte: 

1) Bindung der Nukleinsaurekettenf ragmenten (NSKFs) auf einer 
planen Oberflache mit anschliefiender Hybridisierung von 
Primern, alternativ Bindung von Primern mit anschliefiender 
Hybridisierung von NSKFs, so dass NSKF- Primer- Komplexe 
gebildet werden. 

2) Durchfiihren einer zyklischen Aufbaureaktion, wobei jeder 
Zyklus aus f olgenden Schritten besteht : 

a) Zugabe einer Losung mit markierten Nukleotiden (NTs') 
und Polymerase zu den gebundenen NSKF -Primer - 
Komplexen, 

b) Inkubation der gebundenen NSKF-Primer-Komplexe mit 
dieser Losung unter Bedingungen, die zur VerlSngerung 
der komplementaren Strange urn ein NT geeignet sind, 

c) Waschen, 

d) Detektion der Signale von einzelnen Molekulen, 

e) Entfernung der Markierung von den eingebauten 
Nukleotiden, 

f) Waschen. 

Gegebenenfalls erfolgen mehrfache Wiederholungen des 
Zyklus . 

3) Analyse der detektierten Signale der einzelnen Molekule. 

4) Rekonstruktion der Sequenzen aus den Einzeldaten. 
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1 . Abkurzungen und Begrif f serlauterunaen 

DNA - Desoxyribonukleinsaure verschiedenen Ursprungs und 
unterschiedlicher Lange (genomische DNA, cDNA, ssDNA, dsDNA) 

RNA - Ribonukleinsaure (meist mRNA) 

Polymerasen - Enzyme, die komplementare Nukleotide in einen 
wachsenden DNA- oder RNA-Strang einbauen konnen ( z.B. DNA- 
Polymerasen , Reverse - Transkr ipt asen , RNA- Polymerasen) 

dNTP - 2 1 -deoxi-Nucleosid-Triphosphate, Substrate fur DNA- 
Polymerasen und Reverse-Transkriptasen 

NTP - Nukleosid-Triphosphate, Substrate fur RNA- Polymerasen 

NT - naturliches Nukleotid, meist dNTP, wenn nicht 
ausdrucklich anders gekennzeichnet . 

Abkiirzung "NT" wird auch bei der Langenangabe einer 
Nukleinsauresequenz verwendet, z.B. 1.000 NT. In diesem Fall 
steht "NT" fur Nukleos id -Monophosphate. 

Im Text wird bei Abkurzungen die Mehrzahl durch Verwendung des 
Suffixes "s" gebildet, "NT" steht zum Beispiel fur 

"Nukleotid" , "NTs" steht fur mehrere Nukleotide. 

NT* - modif iziertes Nukleotid, meist dNTP, wenn nicht 
ausdrucklich anders gekennzeichnet. NTs* bedeutet: 
modifizierte Nukleotide 

NSK - Nukleinsaurekette. DNA oder RNA in ihrer ursprunglichen 
Lange 

NSKF - Nukleinsaurekettenf ragment (DNA oder RNA) , das einem 
Teil der Gesamtsequenz entspricht, NSKFs 
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Nukleinsaurekettenfragmente. Die Summe der NSKFs bildet ein 
Aquivalent zur Gesamtsequenz . Die NSKFs konnen beispielsweise 
Fragmente von DNA- oder RNA-Gesamtsequenz sein, die nach 
einem Fragment ierungsschritt entstehen. 

Gesamtsequenz - die in der Sequenzierungsreaktion eingesetzte 
Sequenz oder die eingesetzten Sequenzen, meistens in NSKFs 
uberfuhrt. Sie kann ursprunglich aus einer oder mehreren NSKs 
bestehen. Dabei kann die Gesamtsequenz Teile oder Aquivalente 
einer anderen Sequenz oder von Sequenz -Populationen 
darstellen (z.B. mRNA, cDNA, Plasmid-DNA mit Insert, BAG, 
YAC) und aus einer oder unterschiedlichen Spezies stammen. 

Primerbindungs telle (PBS) - Teil der Sequenz in der NSK oder 
NSKF, an den der Primer bindet. 

Referenzsequenz - eine bereits bekannte Sequenz, zu der die 
Abweichungen in der zu untersuchenden Sequenz bzw. in den zu 
untersuchenden Sequenzen (Gesamtsequenz) ermittelt werden. 
Als Referenzsequenzen konnen in Datenbanken zugangliche 
Sequenzen verwendet werden, wie z.B. aus der NCBI-Datenbank. 

Tm - Schmelztemperatur 

Plane Oberflache - Oberflache, die vorzugsweise folgende 
Merkmale aufweist: 1) Sie erlaubt, mehrere einzelne Molekule, 
vorzugsweise mehr als 100, noch besser mehr als 1000, mit dem 
jeweiligen gegebenen Objektiv-Oberf lache-Abstand bei einer 
Objektivposition gleichzeitig zu detektieren. 2) Die 
immobilisierten einzelnen Molekule befinden sich in derselben 
Fokusebene, die reproduzierbar eingestellt werden kann. 

Weitfeld-Optik-Detektionssystem - Detektionssystem, das 
gleichzeitig Fluoreszenzsignale von einzelnen, auf einer 
Flache verteilten Molekiilen detektieren kann, wobei die 
Flache ca. 100 fim 2 und groSer ist. Ein Beispiel fur Weitfeld- 
Detektionsoptik stellt Fluoreszenzmikroskop Axiovert 200 oder 
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Axioplan 2e (Zeiss) mit einem Planneof luar-Objektiv lOOx NA 
1.4 Olimmersion (Zeiss), oder einem Planapochromat-Objektiv 
lOOx NA 1.4 Olimmersion (Zeiss); die Anregung der Fluoreszenz 
kann dabei mit einer Lampe, z.B. Quecksilberdampf lampe, oder 

5 einem Laser oder Dioden erfolgen. Sowohl Epif luoreszenzmdus 
als auch im Totalref lexions-Fluoreszenzmikroskopie-Modus 
(total internal reflection fluorescence microscopy, TIRF- 
Microscopy) oder Laser-Scanning-Mikroskopie-Modus konnen 
verwendet werden. In dieser Anmeldung wird Gebrauch von 

D dieser Weitf eld-Detektionsoptik gemacht 

Definition der Termination: Als Termination wird in dieser An- 
meldung der reversible Stop des Einbaus der modif izierten 
ungespalteten NTs* bezeichnet. 
> Dieser Begriff ist von dem ublichen Gebrauch des Wortes 
"Termination" durch Dideoxy-NTP bei einer konventionellen 
Sequenziemng zu trennen. 

Die Termination kommt nach dem Einbau eines modif izierten NT* 
zustande. Ein zur Termination fuhrender Substituent- bzw. 
eine Modif ikat ion der 3 "-OH-Position an der Desoxyribose 
eines Nukleotides, die zur Termination fuhrt. Der Substituent 
kann unter milden Bedingungen abgespalten werden, so daS 3"- 
OH Funktion wieder fur den Einbau eines NT* zur Verfiigung 
steht. An diesen Substituenten ist ein Fluoreszenzf arbstof f 
gekoppelt . 

Genprodukte - Bei den Genprodukten handelt es sich urn die 
primaren Genprodukte der Gene. Im wesentlichen handelt es sich 
dabei urn RNA-Transkripte der genannten Gene, welche auch als 
Target - Sequenzen ( oder Target -Nukleinsauresequenzen) 

bezeichnet werden. Diese Target -Sequenzen schlieSen neben mRNA 
auch davon abgeleitete einzelstrangige und doppelstrangige 
cDNA, von cDNA abgeleitete RNA oder von cDNA amplif izierte DNA 
ein, 

Einzelnukleotidpolymorphismen (single nucleotide 
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polymorphisms, SNPs) - Veranderungen in den Sequenzen, die 
als Substitution (Transition oder Transversion) oder als 
Deletion oder Insertion einzelner NT auftreten konnen. 



2 . Stand der Technik 

Die Nukleinsaurenketten-Sequenzanalyse und 

Genexpressionsanalyse sind in vielen Bereichen der 
Wissenschaft, Medizin und Industrie zu einem wichtigen Werk- 
zeug geworden. Zur Analyse wurden mehrere Verfahren 
entwickelt . 

Die bekanntesten Verfahren sind die Ketten- Terminations - 
Sequenzierung nach Sanger (F. Sanger et al. PNAS 1977 v. 74 s. 
5463), die auf dem Einbau von Kettenterminatoren basiert, und 
die Maxam-Gilbert-Methode, die auf Basen-spezif ischer Modi- 
fikation und Spaltung von Nukleinsaureketten beruht (A.M. 
Maxam and W. Gilbert PNAS 1977, v. 74 S.560) . Beide Methoden 
liefern eine Anzahl von Nukleinsaurekettenfragmenten 
verschiedener Langen. Diese Fragmente werden der Lange nach in 
einem Gel auf getrennt . Dabei mussen alle Nachteile der 
Elektrophorese (wie z.B. lange Laufzeit, relativ kurze 
Strecken von Sequenzen, die in einem Ansatz bestimmt werden 
konnen, begrenzte Anzahl der parallelen Ansatze sowie relativ 
groSe Mengen an DNA) in Kauf genommen werden. Diese Methoden 
sind sehr arbeitsintensiv und langsam. 

Ein weiteres Verfahren zur Sequenzierung basiert auf der 
Hybridisierung von Nukleinsaureketten mit kurzen 
Oligonukleotiden. Dabei wird mit mathematischen Methoden 
berechnet, wie viele Oligonukleotide einer bestimmten Lange 
vorhanden sein miissen, urn eine komplette Sequenz zu ermitteln 
(Z.T. Strezoska et al. PNAS 1991 v. 88 S. 10089, R.S.Drmanac et 
al. Science 1993 v. 260 S.1649) . Auch dieses Verfahren ist mit 
Problemen behaf tet : Es kann nur eine Sequenz in einem Ansatz 
bestimmt werden, sekundare Strukturen storen die 
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Hybridisierung und Sequenzwiederholungen verhindern die 
korrekte Analyse. 

Eine andere Moglichkeit zur Sequenzierung haben Arbeitsgruppen 
beispielsweise von (Dower US Patent 5.547.839, Canard et al . 
US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 
1999, v.18 S.1021, Metzker et al. NAR 1994, v. 22, S.4259, 
Welch et al. Nucleosides & Nucleotides 1999, v. 18, S.197) 
entwickelt. Diese Methode wird abgekurzt als BASS (Base 
Addition Sequencing Scheme) oder SBS (Sequecing by Synthesis) 
bezeichnet. Dabei wird eine groSe Anzahl gleicher einzel- 
strangiger DNA-Stucke an einem definierten Ort auf einer 
Oberflache fixiert und das Signal von der Gesamtheit dieser 
vielen identischen DNA-Stucke analysiert. Zu dieser fixierten 
DNA wird eine Losung mit Polymerase und Nukleotiden zugegeben, 
so dass ein komplementarer Strang synthetisiert werden kann. 
Dabei soil die Polymerase schrittweise arbeiten: in jedem 
Schritt wird nur ein einziges Nukleotid eingebaut. Dieses wird 
detektiert, worauf die Polymerase in einem nachsten Zyklus das 
nachste Nukleotid einbaut. 

Trotz des Gelingens einiger einzelner Schritte der Methode 
wurde sie nicht zu einem f unktionsf ahigen Verfahren 
entwickelt. Dies kann beispielsweise auf folgenden Tatsachen 
beruhen: Beim Aufbau der komplementaren Strange tritt sehr 
schnell eine Desynchronisation der Synthese auf, so dass bei 
jedem Schritt die Fehler akkumulieren. Deshalb kdnnen nur 
sehr kurze Fragmente sequenziert werden. Es ist zu betonen, 
dass alle beschriebenen BASS-Methoden nicht auf der Detektion 
von einzelnen Molekulen beruhen. Das Signal wird stattdessen 
von einer groSen Anzahl identischer an einem definierten Ort 
immobilisierter Molekule registriert. Die in diesen Methoden 
ubliche Verwendung der Begriffe "einzelne Molekule " und 
"Molekule" zielt dabei nicht auf individuelle, voneinander 
getrennte Molekule, sondern auf eine Population, die aus 
vielen identischen Molekulen besteht . Identisch heiSt in 
diesem Fall, dass die Molekule die gleiche Sequenz haben. 
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Die Analyse des Genexpressions-Spektrums ist zu einem 
wichtigen Werkzeug in der Wissenschaft geworden. Der Vergleich 
der Genexpressions-Spektren zwischen verschiedenen Zelllinien, 
Geweben Oder Entwicklungsstadien erlaubt Ruckschliisse auf die 
darin ablaufenden spezifischen biologischen Prozesse. So kann 
man z.B. erwarten, dass der Vergleich zwischen Tumorzellen und 
gesunden Zellen gleicher Herkunft Auskunft iiber die am 
Tumorgeschehen beteiligten Gene gibt. Dabei ist wichtig, dass 
die Aktivitat moglichst vieler oder aller Gene gleichzeitig 
analysiert wird. 

Die Analyse der Genexpression ist eine komplexe Aufgabe: Die 
Anzahl der in einem Zelltyp aktiven Gene kann mehrere Tausend 
betragen. Die Analyse sollte aber moglichst alle im Genom der 
betreffenden Art enthaltenen Gene (etwa 32000 beim Menschen) 
berucksichtigen. Hinzu kommt, dass die im jeweiligen Zelluyp 
aktiven Gene erstens meist noch nicht komplett bekannt sind 
und zweitens unterschiedlich stark exprimiert werden. 

Es wurden bereits viele Methoden zur Genexpressionsanalyse 
entwickelt, so z.B. Differential Display (Nature 1984, v. 308 
S.149, Science 1992 v. 257 S.967), Expressed Sequence Tags 
(EST) (Science 1991 v. 252, S.1656, Nature Genetics 1992, v. 2 
S.173), Northern blotting oder RT-PCR (PNAS 1977, v. 74, 
S.5350, Cell 1983 v. 34 S.865, "The PCR Technique, RT-PCR" 
1998, Ed. Paul Suebert, Eaton Publishing) . Alle diese Methoden 
konnen nur eine sehr begrenzte Anzahl an Genen pro Reaktion 
analysieren und sind zum Teil sehr arbeitsintensiv. 

Die am weitesten verbreitete Methode zur parallelen Analyse 
der Genexpressionsmuster ist die Hybridisierung eines zu 
analysierenden Gemischs von cDNA-Molekulen mit an eine 
Oberflache gebundenen Oligonukleotiden, die in einer 
bestimmten Anordnung, meist als "Microarray" fixiert sind 
("Microarray Biochip Technology" 2000, Ed. M.Schena, Eaton 
Publishing, Zhao et al. Gene 1995, v. 156, S.207, Schena et 
al. Science 1995 v. 270, S.467, Lockhart et al. US Patent 
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6.040.138, Wang US Patent 6,004.755, Arlinghaus et al. US 
Patent 5.821.060, Southern US Patent 5.700.637, Fodor et al. 
US Patent 5.871.928) . 

Zu den grofien Nachteilen der Hybridisierungsmethode zahlen: 
Die Fertigung der an die Oberflache gebundenen Oligonukleotide 
ist teuer. Die Analyse beschrankt sich auf Gene, deren 
Sequenzen bereits bekannt sind. Mehrere Mismatch-Kontrollen 
vergroSem die Anzahl der Oligonukleotide, die immobilisiert 
werden mussen. 

Die Aufgabe der vorliegenden Erfindung besteht daher darin, 
ein Verfahren zur Sequenzanalyse von Nukleinsaureketten und 
der Analyse der Genexpression bereitzustellen, das die 
Nachteile der oben erwahnten Methoden nicht aufweist und vor 
allem eine billigere, schnellere und effizientere Analyse von 
Nukleinsauresequenzen ermoglicht . Insbesondere soil das 
Verfahren in der Lage sein, viele Sequenzen parallel zu 
bestimmen. Es kann dann beispielsweise fur die Analyse sehr 
langer Nukleinsaureketten (mehrere Mb) oder fur die 
Variantenalyse an vielen kurzen Ketten (Mutationsanalyse, SNP- 
Analyse) in einem Ansatz verwendet werden. 

3 . Kurze Beschreibung 

Gegenstand der vorliegenden Erfindung ist ein Verfahren zur 
parallelen Sequenzanalyse von Nukleinsauresequenzen (Nu- 
kleinsaureketten, NSKs) geldst, bei dem man 

Fragmente (NSKFs) einzelstrangiger NSKs mit einer Lange 
von etwa 50 bis 1000 Nukleotiden erzeugt, die tiberlappende 
Teilsequenzen der Gesamtsequenzen darstellen, man 

die NSKFs unter Verwendung eines einheitlichen oder 
mehrerer unterschiedlicher Primer in Form von NSKF- Primer- 
Komplexen auf einer Reaktionsoberf l&che in einer 
zufalligen Anordnung bindet, man 
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eine zyklische Aufbaureaktion des komplementaren Stranges 
der NSKFs unter Verwendung einer oder mehrerer Polymerasen 
durchftihrt, indem man 

a) zu den an die Oberflache gebundenen NSKF-Primer- 
Komplexen eine Losung zugibt, die eine oder mehrere 
Polymerasen und ein bis vier modifizierte Nukleotide 
(NTs*) enthalt, die mit Fluoreszenzf arbstof f en markiert 
sind, wobei die bei gleichzeitiger Verwendung von 
mindestens zwei NTs* jeweils an den NTs* befindlichen 
Fluoreszenzfarbstoffe so gewahlt sind, dass sich die ver- 
wendeten NTs* durch Messung unterschiedlicher Fluo- 
reszenzsignale voneinander unterscheiden lassen, wobei 
die NTs* strukturell so modifiziert sind, daS die Poly- 
merase nach Einbau eines solchen NT* in einen wachsenden 
komplementaren Strang nicht in der Lage ist, ein wei te- 
res NT* in denselben Strang einzubauen, wobei der zur 
Termination fuhrende Substituent mit dem Fluores- 
zenzf arbstof f abspaltbar ist, man 

b) die in Stufe a) erhaltene stationare Phase unter 
Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strange geeignet sind, wobei die 
komplementaren Strange jeweils urn ein NT* verlangert 
werden, man 

c) die in Stufe b) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung nicht in einen 
komplementaren Strang eingebauter NTs* geeignet sind, 
man 

d) die einzelnen, in komp lenient are Strange eingebauten 
NTs* durch Messen des fur den jeweiligen Fluo- 
reszenzfarbstoff charakteristischen Signals detek- 
tiert, wobei man gleichzeitig die relative Position 
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der einzelnen Fluoreszenzsignale auf der Reaktions- 
oberflache bestimmt, man 

e) zur Erzeugung unmarkierter (NTs oder) NSKFs die zur 
Termination fuhrenden Substituenten und die 
Fluoreszenzf arbstoffe von den am komplementaren 
Strang angefugten NTs* abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung der Fluo- 
reszenzf arbstoffe und der Liganden geeignet sind, man 

die Stufen a) bis f) gegebenenf alls mehrfach wiederholt, 

wobei man die relative Position einzelner NSKF-Primer-Komplexe 
auf der Reaktionsoberf lache und die Sequenz dieser NSKFs durch 
spezifische Zuordnung der in Stufe d) in auf einanderfolgenden 
Zyklen an den jeweiligen Positionen detektierten Fluores- 
zenzsignale zu den NTs bestimmt. 

Aus den ermittelten Teilsequenzen kann man beispielsweie die 
Gesamtsequenz der NSKs bestimmen. Unter einer parallelen 
Sequenz analyse wird in diesem Zusammenhang die gleichzeitige 
Sequenzanalyse vieler NSKFs verstanden (beispielsweise 
1.000.000 bis 10.000.000), wobei diese NSKFs von einer 
einheit lichen NSK- Population oder von mehreren 

unterschiedlichen NSK-Populationen abgeleitet sind. 

Die erhaltene Population von iiberlappenden Teilsequenzen laSt 
sich beispielsweise bei de novo Sequenzierung mit kommerziell ' 
erhaltlichen Programmen zur Gesamtsequenz der NSK 
zusammenfugen (Huang et al. Genom Res. 1999 v. 9 S.868, Huang 
Genomics 1996 v. 33 S.21, Bonfield et al. NAR 1995 v. 23 S.4992, 
Miller et al. J. Comput .Biol . 1994 v.l S.257) . 

Bei der Analyse von Varianten einer bekannten Referenzsequenz 
lassen sich Mutationen oder Einzelnukleotidpolymorphismen 
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durch einen Vergleich der erhaltenen uberlappenden 
Teilsequenzen mit der Ref erenzsequenz feststellen. 

GemSS einer besonderen Ausfilhrungsform der Erfindung kann das 
Verfahren durchgefiihrt werden, indem man die Stufen a) bis f) 
der zyklischen Auf baureaktion mehrfach wiederholt, wobei man 

a) in jedem Zyklus nur jeweils ein markiertes NT*, 

b) in jedem Zyklus jeweils zwei unterschiedlich markier- 
te NTs* Oder 

c) in jedem Zyklus jeweils vier unterschiedlich markier- 
te NTs* 

einsetzt . 

Wenn die NSKs Varianten einer bekannten Referenzsequenz sind 
kann das Verfahren auch durchgefuhrt werden, indem man die 
Stufen a) bis f) der zyklischen Auf baureaktion mehrfach 
wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei 
unterschiedlich markierte NTs* und zwei unmarkierte NTs 
einsetzt und man die Gesamtsequenzen durch Vergleich mit der 
Referenzsequenz ermittelt . 

Gegenstand der vorliegenden Erfindung ist ferner ein Verfahren 
zur hoch parallelen Analyse der Genexpression, bei dem man 

einzelstrangige Genprodukte bereitstellt , man 

die Genprodukte unter Verwendung eines einheitlichen oder 
mehrerer unterschiedlichen Primer in Form von Genprodukt- 
Primer-Komplexen auf einer Reaktionsoberf lache in einer 
zufalligen Anordnung bindet, man 

eine zyklische Auf baureaktion des komplementaren Stranges 
der Genprodukte unter Verwendung einer oder mehrerer 
Polymerasen durchfuhrt, indem man 
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a) zu den auf der Oberflache gebundenen Genprodukt- 
Primer-Komplexen eine Losung zugibt, die eine oder 
mehrere Polymerasen und ein bis vier modifizierte 
Nukleotide (NTs*) enthalt, die mit Fluoreszenzfarb- 
stoffen markiert sind, wobei die bei gleichzeitiger 
Verwendung von mindestens zwei NTs* jeweils an den 
NTs* befindlichen Fluoreszenzf arbstof f e so gewahlt 
sind, dass sich die verwendeten NTs* durch Messung 
unterschiedlicher Fluoreszenzsignale voneinander 
unterscheiden lassen, wobei die NTs* strukturell ' so 
modifiziert sind, dafi die Polymerase nach Einbau 
eines solchen NT* in einen wachsenden komplementaren 
Strang nicht in der Lage ist, ein weiteres NT* in 
denselben Strang einzubauen, wobei der zur 
Termination fuhrende Substituent mit dem Fluores- 
zenzf arbstof f abspaltbar ist, man 

b) die in Stufe a) erhaltene stationare Phase unter 
Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strange geeignet sind, wobei die kom- 
plementaren Strange jeweils urn ein NT* verlangert 
werden, man 

c) die in Stufe b) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung nicht in 
einen komplementaren Strang eingebauter NTs* ge- 
eignet sind, man 

d) die einzelnen, in komplementare Strange eingebauten 
NTs* durch Messen des fur den jeweiligen Fluo- 
reszenzf arbstof f charakteristischen Signals detek- 
tiert, wobei man gleichzeitig die relative Position 
der einzelnen Fluoreszenzsignale auf der Reaktions- 
oberflache bestimmt, man 

e) zur Erzeugung unmarkierter (NTs oder) NSKFs die zur 
Termination fiihrenden Substituenten mit den 
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Fluoreszenzf arbstof fen von den am komplementaren 
Strang angef ligten NTs* abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung der Fluores- 
zenzf arbstof fe und der Liganden geeignet sind, man 

die Stufen a) bis f) gegebenenf alls mehrfach wiederholt, 

wobei man die relative Position einzelner Genprodukt- 
Primer-Komplexe auf der Reaktionsoberf lache und die 
Sequenz dieser Genprodukte durch spezifische Zuordnung 
der in Stufe d) in auf einanderf olgenden Zyklen an den 
jeweiligen Posit ionen detektierten Fluoreszenzsignale zu 
den NTs bestimmt und man aus den ermittelten Teilse- 
quenzen die Identitat der Genprodukte bestimmt. 



Bei den Genprodukten handelt es sich urn die primaren Gen- 
produkte der Gene, deren Expression analysiert werden soli. Im 
wesentlichen handelt es sich dabei urn RNA-Transkripte der 
genannten Gene, welche auch als Target -Sequenzen (oder Target - 
Nukleinsauresequenzen) bezeichnet werden. Diese Target- 
Sequenzen schlieSen neben mRNA auch davon abgeleitete 
einzelstrangige und doppelstrangige cDNA, von cDNA abgeleitete 
RNA oder von cDNA amplif izierte DNA ein. 

Die Genprodukte oder Target -Sequenzen konnen entweder als 
mRNAs direkt aus einer biologischen Probe (z.B. Zellextrakt, 
Gewebeextrakt oder Extrakt von ganzen Organismen) isoliert 
oder als cDNAs durch reverse Transkription der mRNAs erhalten 
werden . 



Unter einer hoch parallelen Analyse wird in diesem 
Zusammenhang die gleichzeitige Sequenzanalyse vieler 
Genprodukt-Molekule verstanden (beispielsweise 1.000.000 bis 
10.000.000), wobei diese Genprodukt-Molektile eine komplexe 
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heterogene Population darstellen, die z.B. einem kompletten 
Expressionsprof il bzw. einem Expressionsspektrum eines Gewebes 
entspricht . 

GemaS einer besonderen Ausfiihrungsform der Erfindung kann das 
Verfahren durchgefuhrt werden, indem man die Stufen a) bis f) 
der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man 

a) in jedem Zyklus nur jeweils ein markiertes NT*, 

b) in jedem Zyklus jeweils zwei unterschiedlich markier- 
te NTs" Oder 

c) in jedem Zyklus jeweils vier unterschiedlich markier- 
te NTs* 

einsetzt . 

Das Verfahren kann auch durchgefuhrt werden, indem man die 
Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach 
wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei 
unterschiedlich markierte NTs* und zwei unmarkierte NTs 
einsetzt und man die Identitat der Genprodukte durch Vergleich 
mit den Ref erenzsequenzen ermittelt. 

Gegenstand der Erfindung ist ferner ein Kit zur Durchfuhrung 
des Verfahrens das eine Reaktionsoberf lache, zur Durchfuhrung 
des Verfahrens erf orderliche Reaktionslosungen, eine oder 
mehrere Polymerasen, und Nukleotide (NTs) enthalt, von denen 
ein bis vier mit Fluoreszenzf arbstof f en markiert sind, wobei 
die NTs* an der 3' -Position strukturell so modifiziert sind, 
daS die Polymerase nach Einbau eines solchen NT* in einen 
wachsenden komplementaren Strang nicht in der Lage ist, ein 
weiteres NT* in denselben Strang einzubauen, wobei der zur 
Termination fiihrende Substituent mit dem Fluoreszenzf arbstof f 
abspaltbar ist. GemaS einer besonderen Ausfuhrungsform der 
Erfindung enthalt das Kit ferner zur Erzeugung von 
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Einzelstrangen aus Doppelstrangen erf orderliche Reagenzien, 
einzelstrangige Nukleinsauremolekiile, die als PBS in die NSKFs 
eingefuhrt werden, Oligonukleotid- Primer , zur Abspaltung der 
Fluoreszenzfarbstoffe und der zur Termination fiihrenden 
Substituenten erf orderliche Reagenzien und/oder Waschlosungen. 

Die erf indungsgemaSe Methode dient zur Ermittlung der 
Nukleinsauresequenzen und kann in verschiedenen Bereichen der 
Genetik eingesetzt werden. Dazu zahlen insbesondere die 
Bestimmung unbekannter, langer Sequenzen, Analysen von 
Sequenz-Polymorphismen und Punktmutationen sowie die parallele 
Analyse einer groSen Zahl an Gensequenzen, sowie die Analyse 
der Genexpression. 

Bei der Analyse langer Nukleinsaureketten (z.B. 100 Kb und 
langer) hangt die Vorbereitung des zu ' analysierenden 
Materials (einzel- und doppelstrangige Nukleins&uresequenzen) 
von der Auf gabestellung ab und hat das Ziel, aus einer langen 
Nukleinsaurekette eine Population an relativ kleinen, 
einzelstrangigen Nukleinsaurekettenf ragmenten (NSKFs) zu 
bilden, diese Fragmente mit einem fiir den Start der 
Sequenzierungsreaktion geeigneten Primer zu versehen (NSKF- 
Primer-Komplexe) und auf einer planen Oberflache zu fixieren. 

Dabei werden einzelne NSKFs auf einer planen Oberflache in 
einer solchen Weise fixiert, dass eine enzymatische Reaktion 
an diesen Molekulen ablaufen kann. Prinzipiell sind 
verschiedene Arten der Immobilisation moglich, die von der 
Zielsetzung, der Art der NSK und der fftr die Reaktion 
eingesetzten Polymerase abhangen. Die NSKFs werden bei der 
Immobilisierung bzw. Bindung zufallig auf der Oberflache 
verteilt, d.h. es mufi also nicht auf eine exakte 
Positionierung der einzelnen Ketten geachtet werden. NSKF- 
Primer-Komplexe konnen uber die NSKFs oder Primer an die 
Oberflache gebunden werden. Die NSKF- Primer- Komplexe mussen 
dabei in einer solchen Dichte auf der Oberflache fixiert 
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werden, dass eine eindeutige Zuordnung der spater detektierten 
Signale von den eingebauten NT*s zu einzelnen NSKFs 
gewahrleistet ist. 

Nach der Vorbereitung der NSKFs startet man mit alien auf der 
Oberflache immobilisierten NSKF-Primer-Komplex-Molekiilen die 
Sequenzierungsreaktion. Als Grundlage der Sequenzierung dient 
die Synthese des komplementaren Stranges zu jedem einzelnen 
gebundenen NSKF. Dabei werden in den neu synthetisierten 
Strang markierte NTs* eingebaut. Die Polymerase baut in eihem 
Zyklus nur ein einziges markiertes NT* in die wachsende Kette 
ein. 

Die Sequenzierungsreaktion verlauft in mehreren Zyklen. Ein 
Zyklus umfasst folgende Schritte: 

a) Zugabe einer Losung mit markierten Nukleotiden (NTs*) und 
Polymerase zu den gebundenen NSKF-Primer-Komplexen, 

b) Inkubation der gebundenen NSKF-Primer-Komplexe mit dieser 
Losung unter Bedingungen, die zur Verlangerung der kom- 
plementaren Strange urn ein NT geeignet sind, 

c) Waschen, 

d) Detektion der Signale von einzelnen Molekulen, 

e) Entfernung der Markierung von den eingebauten Nukleotiden, 

f) Waschen. 

Gegebenenfalls erfolgt eine mehrfache Wiederholung des Zyklus 
(a-f ) . 

Die Reaktionsbedingungen des Schrittes (b) in einem Zyklus 
werden so gewahlt, dass die Polymerasen an mehr als 50% der an 
der Sequenzierungsreaktion beteiligten NSKFs (extensionsf ahige 
NSKF-Primer-Komplexe) in einem Zyklus ein markiertes NT* 
einbauen konnen, vorzugsweise an mehr als 90%. 

Die Anzahl der durchzufuhrenden Zyklen hSngt dabei von der je- 
weiligen Aufgabenstellung ab, ist theoretisch nicht beschrankt 
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und liegt vorzugsweise zwischen 20 und 5000. 

Danach wird fur jedes fixierte NSKF seine spezifische Sequenz 
aus der Reihenf olge der eingebauten NTs* ermittelt . 

Aus den uberlappenden NSKF-Sequenzen kann in einer 
Ausfuhrungsform die ursprungliche NSK-Sequenz rekonstruiert 
werden ("Automated DNA sequencing and analysis" S. 231 ff. 
1994 M. Adams et al. Academic Press , Huang et al . Genom Res. 
1999 v.9 S.868, Huang Genomics 1996 v. 33 S.21, Bonfield et al. 
NAR 1995 v.23 S.4992, Miller et al. J.Comput .Biol . 1994 v.l 
S.257). Dabei sucht man in der gesamten Population von NSKF- 
Sequenzen nach Ubereinstimmungen/Uberlappungen in den 
Sequenzen von NSKFs. Durch diese 

Ubereinstimmungen/Uberlappungen kann man die NSKF in eine 
Reihe bringen, z.B.: 

ACTGTGCGTCCGTATGATGGTCATTCCATG 

CATTCCATGGTACGTTAGCTCCTAG 

TCCTAGTAAAATCGTACC . 



In der Praxis hat sich bei einer Sequenzierung von unbekannten 
Sequenzen bewahrt, eine Lange der sequenzierten Stucke von 
mehr als 300 bp zu erreichen. Das erlaubt die Sequenzierung 
von Genomen aus Eukaryonten im Schrotschuss-Verf ahren. 

Dabei konnen die Fehler der Methode mit verschiedenen Mitteln 
erfasst und korrigiert werden. Samtliche Schritte des 
Verfahrens konnen weitgehend automatisiert werden. 

Durch die Arbeit mit einzelnen Molekiilen ergeben sich grofie 
Vorteile gegeniiber der friiher beschriebenen BASS-Methode : 

1. Da die Molekiile einzeln detektiert werden, besteht keine 
Gefahr, dass das Signal durch die De synchronisation in der 
Population fehlerhaft wird. Fur jedes fixierte NSKF wird 
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eine eigene Sequenz erstellt. Daher spielt es keine Rolle, 
ob an einem benachbarten Molekul die Synthese bereits 
weiter fortgeschritten oder zuriickgeblieben ist. Dadurch 
wird eine hoch parallele Sequenzierung langer NSKF erst 
moglich. 

2. Es ist nicht notwendig, Molekiile in einer definierten 
Anordnung auf der Oberflache zu fixieren, da das Signal 
von einzelnen Molekiilen ausgeht und nicht von einer 
raumlich definierten Population (was bei BASS-Methoden 
notwendig ist) . 

3 . Es ist nicht zwingend notwendig multiple Kopien von den zu 

analysierenden Nukleinsaureketten herzustellen, so dass 
PCR- und bzw. oder Klonierungsschritte ent fallen konnen. 
Dies fiihrt zu einer enormen Beschleunigung der Analyse im 
Vergleich zu bestehenden Verfahren. 



Das erf indungsgemafie Verfahren zur Analyse der Genexpression 
erhalt durch eine gleichzeitige Sequenzierung einzelner 
Genproduktmolekiile mehrere Vorteile gegenuber bekannten 
Methoden der Analyse der Genexpression: 

1) Die Genprodukte konnen in einer beliebigen Anordnung auf 
der Oberflache binden. Eine vorherige aufwendige Synthese von 
verschiedenen Oligonukleotiden an bestimmten Positionen (wie 
beispielsweise bei der Hybridisierungsmethode) ist somit 
nicht notwendig. 

2) Das Material kann auf einer standardisierten Oberflache 
analysiert werden. 

3) Auch die Expression noch unbekannter Gene kann ermittelt 
werden, weil alle im Ansatz enthaltenen Genprodukte 
analysiert werden. 

4) . Die groSe Anzahl. der analysierten Molekiile erlaubt auch 
die Detektion schwach exprimierter Gene. 

5) Kleins te Mengen an Ausgangsmaterial konnen eingesetzt 
werden: mRNA aus einer einzelnen Zelle kann fur die Analyse 
ausreichend sein. 
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6) Samtliche Schritte des Verfahrens konnen weitgehend 
automatisiert werden. 

Die Methode basiert auf mehreren Prinzipien: 

1. Kurze Nukleotidsequenzen (10-50 NTs) enthalten genugend 
Informationen zur Identif izierung des korrespondierenden Gens, 
wenn die Gensequenz selbst bereits in einer Datenbank 
enthalten ist. 

Eine Sequenz aus beispielsweise 10 NTs kann mehr als 10 6 
verschiedene Kombinationen bilden. Das ist z.B. fur die 
meisten Gene im menschlichen Genom, das nach heutiger 
Schatzung 32000 Gene enthalt, ausreichend. Fur Organismen mit 
weniger Genen kann die Sequenz noch kiirzer sein. 

2. Der Methode liegt ein neues Verfahren zur die Sequenzierung 
einzelner Nukleinsaurekettenmolekule zugrunde. 

3. Es konnen Nukleinsaureketten-Gemische untersucht werden. 

4. Die Sequenz ierungsreakt ion lauft an vielen Molekulen 
gleichzeitig ab, wobei die Sequenz jeder einzelnen gebundenen 
NukleinscLurekette analysiert wird. 

Es ist bekannt, dass zur Untersuchung der Genexpression mRNAs 
Oder von der raRNA abgeleitete Nukleinsaureketten (z.B. 
einzelstrangige cDNAs, doppelstrangige cDNAs, von cDNA 
abgeleitete RNA oder von cDNA amplif izierte DNA) eingesetzt 
werden kann. Unabhangig von der genauen Zusammensetzung werden 
sie im folgenden als Genprodukte ■ bezeichnet. Auch 
Teilsequenzen dieser Genprodukte werden im folgenden als 
Genprodukte bezeichnet. 

Diese Genprodukte stellen ein Gemisch aus verschiedenen Nu- 
kleinsaureketten dar. 

Als Grundlage der Analyse dient die Synthese eines zum 
Genprodukt komplementaren Stranges. 
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Das Ziel der Vorbereitung ist, auf einer planen Oberflache in 
zufalliger Weise gebundene Genprodukt-Primer-Komplexe 
bereitzustellen, an denen der Einbau von NT*s durch die 
Polymerase stattfinden kann (extensionsf ahige Genprodukt- 
Primer-Komplexe) . 

Mit diesen gebundenen Genprodukt-Primer-Komplexen wird die 
Sequenzierungsreaktion durchgef uhrt . 

-Sie verlauft in mehreren Zyklen. Pro Zyklus wird jeweils nur 
ein einziges markiertes NT* in den wachsenden Strang 
eingebaut. Ein Zyklus umfasst folgende Schritte: 

a) Zugabe einer Losung mit markierten Nukleotiden (NTs*) und 
Polymerase zu gebundenen Genprodukt-Primer-Komplexen, 

b) Inkubation der gebundenen Genprodukt-Primer-Komplexe mit 
dieser Losung unter Bedingungen, die zur Verlangerung der 
komplementaren Strange urn ein' NT geeignet sind, 

c) Waschen, 

d) Detektion der Signale von einzelnen modif izierten, in die 
neu synthetisierten Strange eingebauten NTs*-Molekulen, 

e) Entfernung der Markierung von den eingebauten Nukleoti- 
den, 

f) Waschen. 

Dieser Zyklus kann mehrmals wiederholt werden, so dass von 
jedem an der Sequenzierungsreaktion teilnehmenden Genprodukt- 
Primer-Komplex vorzugsweise 10 bis 50 NTs ermittelt werden. 
Danach erfolgt die Rekonstruktion der Nukleinsauresequenzen 
aus den detektierten Signalen. Die ermittelten Sequenzen der 
gebundenen Genprodukte werden zur Bestimmung der Abundanzen 
untereinander verglichen und durch Vergleich mit Gensequenzen 
in Datenbanken bestimmten Genen zugeordnet. 

- Detaillierte Beschreibuna 
Allgemeine Prinzipien der Reaktion, Materialauswahl und 
Materialvorbereitung (Erzeugung kurzer NSKFs, Einfuhriing 
einer PBS, Einzelstrangvorbereitung, Primerauswahl, Fixierung 
von NSKFs) , sowie die Detektionsapparatur und Detektion 
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werden am Beispiel des Verfahrens zur Sequenzierung langer 
NSKs dargestellt. Das Verfahren zur Analyse der Genexpression 
wird anschliefiend im Beispiel 3 beschrieben. 

4.1 Allgemeine Prinzipien der Reaktion 

Im folgenden sollen anhand der Sequenzierung eines mehrere Mb 
langen DNA-Stuckes beispielhaft die allgemeinen Prinzipien der 
Reaktion dargestellt werden (Fig. 1) . Der Sequenzierung und 
der Rekonstruktion von Nukleinsaurensequenzen liegt das 
Shotgun- Prinzip zugrunde ("Automated DNA sequencing and 
analysis" S. 231 ff. 1994 M. Adams et al. Academic Press , 
Huang et al. Genom Res. 1999 v. 9 S.868, Huang Genomics 1996 
v.33 S.21, Bonfield et al. NAR 1995 v. 23 S.4992, Miller et al. 
J.Comput .Biol . 1994 v.l S.257). Die Sequenz eines langen DNA- 
Stucks wird dabei durch die Sequenzierung kleiner DNA- Frag - 
mente und nachfolgender Rekonstruktion ermittelt. Das zu 
analysierende Material (1) wird fur die Sequenzierungsreaktion 
vorbereitet, indem es in Fragmente von vorzugsweise 50 bis 
1000 bp Lange zerlegt wird (2) . Jedes Fragment wird 
anschlieSend mit einer Primerbindungsstelle und einem Primer 
versehen (3) . Dieses Gemisch aus verschiedenen DNA- Fragment en 
wird nun auf einer planen Oberflache fixiert (4). Die nicht 
gebundenen DNA-Fragmente werden durch einen Waschschritt 
entfernt. Danach wird die Sequenzierungsreaktion an der 
gesamten Reaktionsoberf lache durchgef uhrt . Diese Reaktion 
verlauft zyklisch. Im 1. Schritt des Zyklus wird ein mit einem 
Fluoreszenzf arbstof f markiertes NT* in den wachsenden Strang 
eingebaut: Dabei wird die Reaktion so gesteuert, dass in jedem 
Zyklus jeweils nur ein markiertes NT* von einer Polymerase in 
den wachsenden Strang eingebaut werden kann. Das wird durch 
die Verwendung von NTs* erreicht, die an der 3 "-Position der 
Desoxyribose ein reversibel gekoppeltes, zur Termination 
fuhrenden Substituenten tragen. Der Einbau eines weiteren 
markierten NT* wird dadurch unmoglich gemacht. Die Polymerase 
und die markierten NTs* werden gleichzeitig in die Reaktion 
eigesetzt (5) .Danach wird das Reaktionsgemisch entfernt und 
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die Oberflache in geeigneter Art und Weise gewaschen (6) . Nun 
folgt ein Detektionsschritt (7) : Die Oberflache wird mit einer 
fur die Einzelmolekuldetektion geeigneten Vorrichtung 
{bestehend aus Lichtquelle, Mikroskop, Kamera, Scantisch, 
Computer mit Steuerungs- und Bilderkennungs- bzw. Bild- 
verarbeitungs software) abgescannt und die Signale der 
einzelnen, eingebauten markierten NTs* identif iziert . Nach dem 
Detektionsschritt wird die Markierung und der zur Termination 
fiihrende Substituent von alien eingebauten NTs* entfernt (8) . 
Nach einem sich anschlieSenden Waschschritt kann ein neiier 
Zyklus beginnen. Zur Rekonstruktion einer groSeren urspriing- 
lichen DNA-Sequenz (z.B. mehrere Mb langes DNA- Stuck) sollen 
die DNA-Fragmente einige Hundert NT lang sein, falls man die 
Rekonstruktion nach dem Shotgun-Prinzip durchfuhrt ("Automated 
DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al . 
Academic Press, Huang et al . Genom Res. 1999 v. 9 S.868, Huang 
Genomics 1996 v. 33 S.21, Bonfield et al. NAR 1995 v. 23 S.4992, 
Miller et al. J.Comput .Biol . 1994 v.l S.257). Da pro Zyklus 
nur jeweils ein markiertes NT* eingebaut wird, sind mindestens 
300 Zyklen zur Sequenzierung notwendig. 

4.2 Auswahl des Materials 

Mit Hilfe der erf indungsgemafien Methode ist es moglich, sowohl 
vorselektionierte DNA-Sequenzen (z.B. in YAC-, PAC-, oder BAC- 
Vektoren (R. Anand et al. NAR 1989 v. 17 S.3425, H. Shizuya et 
al. PNAS 1992 v.89 S.8794, "Construction of bacterial 
artificial chromosome libraries using the modified PAC system" 
in "Current Protocols in Human genetics" 1996 John Wiley & 
Sons Inc.) klonierte Abschnitte eines Genoms) als auch nicht 
vorselektionierte DNA (z.B. genomische DNA, cDNA-Gemische) zu 
analysieren. Durch eine Vorselektion ist es moglich, im 
Vorfeld relevante Informationen, wie z.B. Sequenz -Abschnitte 
aus einem Genom oder Populationen an Genprodukten, aus der 
groJSe Menge genetischer Informationen herauszuf iltern und 
damit die Menge der zu analysierenden Sequenzen 
einzuschranken. Besonders hervorzuheben sind die 
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Ausfuhrungsformen, bei denen die erf indungsgemaSen Verfahren 
ohne Vorselektionierung und ohne eine Vervielfaltigung des 
Materials eingesetzt werden. Verzicht auf PCR und Klonierung 
bringt eine entscheidende Beschleunigung in der hoch 
parallelen Analyse von Nukleinsauresequezen, was mit anderen 
Verfahren bis jetzt nicht moglich war. 

4.3 Vorbereitung des Materials 

Ziel der Materialvorbereitung ist es, gebundene einzel- 
strangige NSKFs mit einer Lange von vorzugsweise 50-1000 NTs, 
einer einzelnen Primerbindungsstelle und einem hybridisierten 
Primer (gebundene NSKF-Primer-Komplexe) zu erhalten. Diese 
NSKF-Primer-Komplexe haben beispielsweise die in Fig. 2 
dargestellte Struktur. Ira einzelnen konnen sehr variable 
Konstruktionen aus dieser allgemeinen Struktur abgeleitet wer- 
den. Zur Verbesserung der Anschaulichkeit folgen nun einige 
Beispiele, wobei die angefuhrten Methoden einzeln oder in 
Kombination eingesetzt werden konnen. 

4.3.1 Erzeugung kurzer Nukleinsaurekettenf ragmente (50-1000 
NTs) ( Fragment ierungsschritt) 

Wichtig ist, dass die Fragment ierung der NSKs so erfolgt, dass 
Fragmente erhalten werden, die uberlappende Teilsequenzen der 
Gesamtsequenzen darstellen. Dies wird durch Verfahren 
erreicht, bei denen unterschiedlich lange Fragmente als Spalt- 
produkte in zuf allsmafiiger Verteilung entstehen. 

Erf indungsgemaS kann die Erzeugung der Nukleinsaureketten- 
fragmente (NSKFs) durch mehrere Methoden erfolgen, z.B. durch 
die Fragment ierung des Ausgangsmaterials mit Ultraschall oder 
durch Endonukleasen ("Molecular cloning". 1989 J.Sambrook et 
al. Cold Spring Harbor Laborotary Press), wie z.B. durch 
unspezif ische Endonukleasegemische . Erf indungsgemaS wird die 
Ultraschall-Fragmentierung bevorzugt. Man kann die Bedingungen 
so einstellen, dass Fragmente mit einer durchschnittlichen 
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Lange von 100 bp bis 1 kb entstehen. Diese Fragmente werden 
anschliefiend an ihren Enden durch das Kl enow -Fragment (E.coli- 
Polymerase I) oder durch die T4-DNA- Polymerase aufgefullt 
("Molecular cloning" 1989 J.Sambrook et al. Cold Spring 
Harbor Laborotary Press) . 

Ausserdem konnen aus einer langen NSK unter Verwendung 
randomisierter Primer komplementare kurze NSKFs synthetisiert 
werden. Besonders bevorzugt wird diese Methode bei der Analyse 
der Gen-Sequenzen. Dabei werden an der mRNA einzelstrangige 
DNA-Fragmente mit randomisierten Primern und einer reversen 
Transkriptase gebildet (Zhang-J et al. Biochem.J. 1999 v. 337 
S.231, Ledbetter et al. J.Biol.Chem. 1994 v. 269 S. 31544, Kolls 
et al. Anal.Biochem. 1993 v. 208 S.264, Decraene et al. 
Biotechniques 1999 v. 27 S.962). 

4.3.2 Einfuhrung einer Primerbindungsstelle in das NSKF. 

Die Primerbindungsstelle (PBS) ist ein Sequenzabschnitt , der 
eine selektive Bindung des Primers an das NSKF ermdglichen 
soil. 

In einer Aus fuhrungs form konnen die Primerbindungsstellen 
unterschiedlich sein, so dass mehrere unterschiedlche Primer 
verwendet werden imissen. In diesem Fall konnen bestimmte 
Sequenzabschnitte der Gesamtsequez als natiirliche PBSs fur 
spezifische Primer dienen. Diese Aus fuhrungs form ist besonders 
fur die Untersuchung bereits bekannter SNP-Stellen geeignet, 
s. Beispiel 4 "SNP-Analyse mit sequenzspezif ischen Primern" . 

In einer anderen Aus fuhrungs form ist es aus Grunden der 
Vereinf achung der Analyse gunstig, wenn eine einheitliche 
Primerbindungsstelle in alien NSKFs vorhanden ist. GemaS einer 
bevorzugten Aus fuhrungs form der Erfindung werden die 
Primerbindungsstellen daher in die NSKFs extra eingefuhrt. Auf 
diese Weise konnen Primer mit einheitlicher Struktur fur die 
Reaktion eingesetzt werden. 
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Im folgenden wird diese Ausfiihrungsform detailliert 
beschrieben. 

Die Zusammensetzung der Primerbindungsstelle ist nicht einge- 
schrankt. Ihre Lange betragt vorzugsweise zwischen 20 und 50 
NTs . Die Primerbindungsstelle kann eine funktionelle Gruppe 
zur Immobilisation des NSKF tragen. Diese funktionelle Gruppe 
kann z.B. eine Biotingruppe sein. 

Als Beispiel fur die Einfuhrung einer einheitlichen 
Primerbindungsstelle werden im folgenden die Ligation und das 
Nukleot id-Tailing an DNA- Fragment e beschrieben. 

a) Ligation: 

Dabei wird ein doppelstrangiger Oligonukleotidkomplex mit 
einer Primerbindungsstelle verwendet (Fig. 3a) . Dieser wird 
mit kommerziell erh£ltlichen Ligasen an die DNA- Fragment e 
ligiert ("Molecular cloning" 1989 J.Sambrook et al. Cold 
Spring Harbor Laborotary Press) . Es ist wichtig, dass nur eine 
einzige Primerbindungsstelle an das DNA- Fragment ligiert wird. 
Das erreicht man z.B. durch eine Modifikation einer Seite des 
Oligonukleotidkomplexes an beiden Strangen (Fig. 3b) . Die 
Resultate nach der Ligation bzw. nach anschlieSender 
Denaturierung sind in Fig. 3c und 3d dargestellt. Die 
modifizierenden Gruppen am Oligonukleotidkompex konnen zur 
Immobilisation dienen. Die Synthese und die Modifikation eines 
solchen Oligonukleotidkomplexes kann nach standardisierten 
Vorschrif ten durchgef uhrt werden . Zur Synthese kann z.B. der 
DNA- Synthesizer 380 A Applied Biosystems verwendet werden. 
Oligonucleotide mit einer bestimmten Zusammensetzung mit Oder 
ohne Modif ikationen sind aber auch als Auf tragssynthese 
kommerziell erhaltlich, z.B. von MWG-Biotech GmbH, Germany. 

b) Nukleotid-Tailing : 

Statt der Ligation mit einem Oligonukleotid kann man mit einer 
terminalen Deoxynucleot idyl transferase mehrere (z.B. zwischen 
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10 und 20) Nukleosid-monophosphate an das 3 1 -Ende eines ss- 
DNA- Fragments ankniipfen ("Molecular cloning" 1989 J.Sambrook 
et al- Cold Spring. Harbor Laborotary Press, "Method in 
Enzymology" 1999 v. 303, S. 37-38) (Fig. 4), z.B. mehrere Guano- 
sin-Monophosphate ( (G) n-Tailing genannt) . Das entstehende 
Fragment wird zur Bindung des Primers, in diesem Beispiel 
eines (C) n-Primers, verwendet. 

4.3.3 Einzelstrang-Vorbereitung 

Fur die Sequenzierungsreaktion werden einzelstrangige NSKFs 
benotigt. Falls das Ausgangsmaterial in doppelstrangiger Form 
vorliegt, gibt es mehrere Moglichkeiten, aus doppelstrangiger 
DNA eine einzelstrangige Form zu erzeugen (z.B. Hitze- 
Denaturierung oder Alkali -Denaturierung) ("Molecular cloning" 
1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press) . 

4.3.4 Primer fiir die Sequenzierungsreaktion 

Dieser hat die Funktion, den Start an einer einzigen Stelle 
des NSKF zu ermoglichen. Er bindet an die Primerbindungsstelle 
im NSKF. Die Zusammensetzung und die Lange des Primers sind 
nicht eingeschrankt . AuSer der Startfunktion kann der Primer 
auch andere Funktionen libernehmen, wie z.B. eine Verbindung 
zur Reaktionsoberflache zu schaffen. Primer sollten so an die 
Lange und Zusammensetzung der Primerbindungsstelle angepafit 
werden, dass der Primer den Start der Sequenzierungsreaktion 
mit der jeweiligen Polymerase ermoglicht. 

Bei der Verwendung unterschiedlicher, beispielsweise naturlich 
in der ursprunglichen Gesamtsequenz vorkommender 
Primerbindungsstellen, werden die fiir die jeweilige 
Primerbindungsstelle sequenzspezif ischen Primer verwendet. In 
diesem Fall wird fiir die Sequenzierung ein Primergemisch 
eingesetzt. 

Bei einer einheit lichen, beispielsweise durch die Ligation an 
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die NSKFs angekoppelten Prime rbindungss telle wird ein 
einheitlicher Primer verwendet. 

Vorzugsweise betragt die Lange des Primers zwischen 6 und 100 
NTs, optimalerweise zwischen 15 und 30 NTs. Der Primer kann 
eine Funktionsgruppe tragen, die zur Immobilisierung des NSKF 
dient, beispielsweise ist eine solche Funktionsgruppe eine 
Biotingruppe (s. Abschnitt Immobilisierung). Sie soli die 
Sequenzierung nicht storen. Die Synthese eines solchen Primers 
kann z.B. mit dem DNA-Synthesizer 380 A Applied Biosystems 
ausgefuhrt werden oder aber als Auf tragssynthese bei einem 
kommerziellen Anbieter, z.B. MWG-Biotech GmbH, Germany 
erstellt werden) . 

Der Primer kann vor der Hybridisierung an die zu 
analysierenden NSKFs auf der Oberflache mit verschiedenen 
Techniken fixiert oder direkt auf der Oberflache 

synthetisiert werden, beispielsweise nach (McGall et al. US 
Patent 5412087, Barrett et al. US Patent 5482867, Mirzabekov 
et al. US Patent 5981734, "Microarray biochip technology" 2000 
M.Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena 
Oxford University Press, Fodor et al. Science 1991 v. 285 
3.167 f Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 
S.3142, Ghosh et al . NAR 1987 v. 15 S.5353, Gingeras et al. NAR 
1987 v.15 S.5373, Maskos et al. NAR 1992 v. 20 S.1679). 

Die Primer werden auf der Oberflache beispielsweise in einer 
Dichte zwischen 10 bis 100 pro 100 pm 2 , 100 bis 10.000 pro 100 
jxm 2 oder 10.000 bis 1.000.000 pro 100/zm 2 gebunden. 

Der Primer oder das Primergemisch wird mit NSKFs unter 
Hybridisierungsbedingungen inkubiert, die ihn selektiv an die 
Primerbindungsstelle des NSKF binden lassen. Diese Primer- 
Hybridisierung (Annealing) kann vor (1) , wahrend (2) oder nach 
(3) der Bindung der NSKFs an die Oberflache erfolgen. Die 
Optimierung der Hybridisierungsbedingungen hangt von der 
genauen Struktur der Primerbindungsstelle und des Primers ab 
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und laEt sich nach Rychlik et al. NAR 1990 v. 18 S.6409 
berechnen. Im folgenden werden diese Hybridisierungsbedingun- 
gen als standardisierte Hybridisierungsbedingungen bezeichnet. 

Falls eine fur alle NSKFs geraeinsame Primerbindungsstelle mit 
bekannter Struktur beispielsweise durch Ligation eigefiihrt 
wird, konnen Primer mit einheitlicher Struktur eingesetzt 
werden. Die Primerbindungsstelle kann an ihrem 3 1 -Ende eine 
funktionelle Gruppe tragen, die z.B. zur Immobilisation dient. 
Beispielsweise ist diese Gruppe eine B io tin- Gruppe . Der Primer 
hat eine zur Primerbindungsstelle komplementare Struktur. 

Ein Beispiel einer Primerbindungstelle und eines Primers ist 
nachf olgend dargestellt . 

5 ■ TAATACGACTCACTATAGG3 ' Primer (T7-19-Primer) 

Biotin- 3 ' ATTATGCTGAGTGATATCC5 ' Primerbindungsstelle 

4.3.5 Fixierung von NSKF-Primer-Komplexe an die Oberflache 
(Bindung bzw. Immobilisierung von NSKFs) . 

Ziel der Fixierung (Immobilisierung) ist es, NSKF- Primer - 
Komplexe auf einer geeigneten planen Oberflache in einer Art 
und Weise zu fixieren, dass eine zyklische enzymatische 
Sequenzierungsreaktion ablaufen kann. Dies kann beispielsweise 
durch Bindung des Primers (s.o.) oder des NSKF an die 
Oberflache erfolgen. 

Die Reihenfolge der Schritte bei der Fixierung von NSKF- 
Primer-Komplexen kann variabel sein: 

1) Die NSKF-Primer-Komplexe konnen zunachst in einer Losung 
durch Hybridisierung (Annealing) gebildet und 
anschlieSend an die Oberflache gebunden werden. 

2) Primer konnen zunachst auf einer Oberflache gebunden 
werden und NSKFs anschliefcend an die gebundenen Primer 
hybridisiert werden, wobei NSKF-Primer-Komplexe 
entstehen (NSKFs indirekt an die Oberflache gebunden) 
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3) Die NSKFs konnen zunachst an die Oberflache gebunden 
werden (NSKFs direkt an die Oberflache gebunden) und im 
anschlieSenden Schritt die Primer an die gebundenen 
NSKFs hybridisiert werden, wobei NSKF-Primer-Komplexe 
enstehen. 

Die Immobilisierung der NSKFs an die Oberflache kann daher 
durch direkte oder indirekte Bindung erfolgen. 

Oberflache und Reaktionsoberf lache sind vorliegend als 
gleichwertige Begriffe aufzufassen, auSer wenn explizit auf 
eine andere Bedeutung hingewiesen wird. Als 
Reaktionsoberf lache dient die Oberflache einer festen Phase 
eines beliebigen Materials. Dieses Material ist vorzugsweise 
enzymatischen Reaktionen gegenuber inert und verursacht keine 
Storungen der Detektion. Silicon, Glas, Keramik, Kunststoff 

(z.B. Polycarbonate oder Polystyrole) , Metall (Gold, Silber, 
Oder Alluminium) oder beliebiges anderes Material, das diesen 
funktionellen Anf orderungen genugt, kann verwendet werden. 
Vorzugsweise ist die Oberflache nicht verformbar, denn sonst 
ist mit einer Verzerrung der Signale bei der wiederholten 
Detektion zu rechnen. 

Falls eine gelartige feste Phase (Oberflache eines Gels) 
verwendet wird, so kann dieses Gel z.B. ein Agarose- oder 
Polyacrylamidgel sein. Das Gel ist vorzugsweise fur Molekiile 
mit einer Molekularmasse unter 5000 Da frei passierbar 
(beispielsweise kann ein 1 bis 2% Agarose-Gel oder 10 bis 15% 
Polyacrylamid Gel verwendet werden) . Eine solche Geloberf lache 
hat anderen festen Oberflachen gegenuber den Vorteil, dass es 
zu einer wesentlich geringeren unspezif ischen Bindung von NT*s 
an die Oberflache kommt. Durch die Bindung der NSKF-Primer- 
Komplexe auf der Oberflache ist die Detektion der 
Fluoreszenzsignale von eingebauten NTs* moglich. Die Signale 
von freien NTs* werden nicht detektiert, weil sie nicht an das 
Material des Gels binden und somit nicht immobilisiert werden. 
Das Gel ist vorzugsweise auf einer festen Unterlage befestigt 
(Fig. 5a) . Diese feste Unterlage kann Silicon, Glas, Keramik, 
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Kunststoff (z.B. Polycarbonate oder Polystyrole) , Metall 
(Gold, Silber, oder Alluminium) oder beliebiges anderes 
Material sein. 

Die Dicke des Gels betragt vorzugsweise nicht mehr als 0,1 mm. 
Die Geldicke ist vorzugsweise groEer als die einfache 
Tiefenscharfe des Objektivs sein, damit unspezif isch an die 
feste Unterlage gebundene NTs* nicht in die , Fokusebene 
gelangen und damit detektiert werden. Wenn die Tiefenscharfe 
z.B. 0,3 \im betragt, so liegt die Geldicke vorzugsweise 
zwischen 1 jim und 100 \im. Die Oberflache kann als eine 
kontinuierliche Oberflache oder als diskontinuierliche, aus 
einzelnen kleinen Bestandteilen (z.B. Agarose -Kiigelchen) 
zusammengesetzte Oberflache hergestellt werden (Fig. 5b). Die 
Reaktionsoberf lache mufi grofi genug sein, urn die notwendige 
Anzahl der NSKFs bei entsprechender Dichte immobilisieren zu 
konnen. Die Reaktionsoberf lache sollte vorzugsweise nicht 
grofier als 20 cm 2 sein. 

Die verschiedenen Zyklusschritte erfordern einen Austausch der 
unterschiedlichen Reaktionsldsungen uber der Oberflache. Die 
Reaktionsoberf lache ist vorzugsweise Bestandteil eines 
Reaktionsgef a£es . Das Reaktionsgef a£ ist wiederum vorzugsweise 
Bestandteil einer Reaktionsapparatur mit Durchf luEvorrichtung. 
Die Durchf luEvorrichtung ermoglicht einen Austausch der 
Losungen im Reaktionsgef aS. Der Austausch kann mit einer durch 
einen Computer gesteuerten Pumpvorrichtung oder manuell 
erfolgen. Wichtig dabei ist, dass die Oberflache nicht 
austrocknet. Vorzugsweise betragt das Volumen des 
Reaktionsgef a£es weniger als 50 pi. Idealerweise betragt sein 
Volumen weniger als 1 jjI. Ein Beispiel eines solchen 
DuchfluSsystems ist in Fig. 6 gegeben. 

Falls die Fixierung der NSKF-Primer-Komplexe auf der 
Oberflache uber die NSKFs erfolgt, kann dies beispielsweise 
durch die Bindung der NSKFs an einem der beiden Ketten-Enden 
erfolgen. Dies kann durch entsprechende kovalente, affine oder 
andere Bindungen erreicht werden. Es sind viele Beispiele der 
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Immobilisierung von Nukleinsauren bekannt (McGall et al. US 
Patent 5412087, Nikiforov et al. US Patent 5610287, Barrett et 
al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, 
"Microarray biochip technology" 2000 M.Schena Eaton 
Publishing, "DNA Microarrays" 1999 M. Schena Oxford University 
Press, Rasmussen et al. Analytical Biochemistry v. 198, S.138, 
Allemand et al. Biophysical Journal 1997, v. 73, S.2064, 
Trabesinger et al. Analytical Chemistry 1999, v. 71, S.279, 
Osborne et al. Analytical Chemistry 2000, v. 72, S.3678, 
Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 S.3142, 
Ghosh et al. NAR 1987 v. 15 S.5353, Gingeras et al. NAR 1987 
v. 15 S.5373, Maskos et al. NAR 1992 v. 20 S.1679). Die 
Fixierung kann auch durch eine unspezif ische Bindung, wie 
z.B. durch Austrocknung der NSKFs enthaltenden Probe auf der 
planen Oberflache erreicht werden. 

Die NSKFs werden auf der Oberflache beispielsweise in einer 
Dichte zwischen 10 und 100 NSKFs pro 100 ]im 2 , 100 bis 10.000 
pro 100 /zm 2 , 10.000 bis 1.000.000 pro 100/xm 2 gebunden. 

Die fur die Detektion notwendige Dichte von ext ens ions fahigen 
NSKF-Primer-Komplexen betragt ca. 10 bis 100 pro 100 /xm 2 . Sie 
kann vor, wahrend oder nach der Hybridisierung der Primer an 
die Genprodukte erreicht werden. 

Beispielhaft werden im folgenden einige Methoden zur Bindung 
von NSKF-Primer-Komplexen naher dargestellt: In einer Aus- 
fuhrungsform erfolgt die Immobilisierung der NSKFs liber 
Biotin-Avidin oder Biotin-Streptavidin-Bindung. Dabei wird 
Avidin oder Streptavidin auf der Oberflache kovalent gebunden, 
das S'-Ende des Primers enthalt Biotin. Nach der 
Hybridisierung der markierten Primer mit den NSKFs (in Losung) 
werden diese auf der mit Avidin/Streptavidin beschichteten 
Oberflache f ixiert . Die Konzentration der mit Biotin 
markierten Hybridisierungs-Produkte sowie die Zeit der 
Inkubation dieser Losung mit der Oberflache wird so gewahlt, 
dass eine fur die Sequenzierung geeignete Dichte bereits in 
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diesem Schritt erreicht wird. 

In einer anderen bevorzugten Ausf iihrungsform werden die fur 
die Sequenzierungsreaktion geeigneten Primer vor der 
Sequenzierungsreaktion auf der Oberflache mit geeigneten 
Methoden fixiert (s.o.). Die einzelstrangigen NSKFs mit 
jeweils einer Primerbindungsstelle pro NSKF werden damit unter 
Hybridisierungsbedingungen inkubiert (Annealing) . Dabei binden 
sie an die fixierten Primer und werden dadurch gebunden 
(indirekte Bindung) , wobei Primer-NSKF-Komplexe entstehen. Die 
Konzentration der einzelstrangigen NSKFs und die 
Hybridisierungsbedingungen werden so gew&hlt, dass man eine 
fur die Sequenzierung geeignete Immobilisationsdichte von 10 
bis 100 extensionsfahigen NSKF-Primer-Komplexen pro 100 ]im 2 
erreicht . Nach der Hybridisierung werden ungebundene NSKFs 
durch einen Waschschritt entfernt. Bei dieser Ausf iihrungsform 
wird eine Oberflache mit einer hohen Primerdichte bevorzugt, 
z.B. ca. 1.000.000 Primer pro 100/im 2 oder noch hoher, da die 
gewunschte Dichte an NSKF-Primer-Komplexen schneller erreicht 
wird, wobei die NSKFs nur an einen Teil der Primer binden. 

In einer anderen Ausfuhrungsf orm werden die NSKFs an die 
Oberflache direkt gebunden (s.o.) und anschliefcend mit Primern 
unter Hybridisierungsbedingungen inkubiert. Bei einer Dichte 
von ca. 10 bis 100 NSKFs pro 100/xm 2 wird man versuchen alle 
verfugbaren NSKFs mit einem Primer zu versehen und fur die 
Sequenzierugnsreaktion verfugbar zu machen. Dies kann z.B. 
durch hohe Primerkonzentration, beispielsweise 1 bis 100 
mmol/1, erreicht werden. Bei einer hoheren Dichte der 
fixierten NSKFs auf der Oberflache, beispielsweise 10.000 bis 
1.000.000 pro 100/xm 2 , kann die fur die optische Detektion 
notwendige Dichte der NSKF-Primer-Komplexe wahrend der 
Primer-Hybridisierung erreicht werden. Dabei sind die 
Hybridisierungsbedingungen (z.B. Temperatur, Zeit, Puffer, 
Primerkonzentration) so zu wahlen, dass die Primer nur an 
einen Teil der immobilisierten NSKFs binden. 
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Falls die Oberflache einer festen Phase (z.B. Silikon oder 
Glas) zur Immobilisation verwendet wird, wird vorzugsweise 
eine Blockierungsldsung auf die Oberflache vor dem Schritt (a) 
in jedem Zyklus gebracht, die zur Vermeidung einer unspezifi- 
schen Adsorbtion von NTs* an der Oberflache dient. Diese 
Bedingungen fur eine Blockierlosung erfullt beispielsweise 
eine Albuminlosung (BSA) mit einem pH-Wert zwischen 8 und 10. 

4 . 4 Wahl der Polymerase 

Als Polymerasen eignen sich prinzipiell alle DNA-abhangigen 
DNA-Polymerasen ohne 3' -5' Exonuklease-Aktivitat (DNA- 
Replication" 1992 Ed. A.Kornberg, Freeman and company NY), 
z.B. modifizierte T7- Polymerase vom Typ "Sequenase Version 2" 
(Amersham Pharmacia Biotech), 3* -5' exonuklease freies Klenow 
Fragment der DNA- Polymerase I (Amersham Pharmacia Biotech) , 
Polymerase Beta verschiedenen Ursprungs (Animal Cell DNA 
Polymerases" 1983, Fry M. , CRC Press Inc., kommerziell 
erhaltlich bei Chimerx) thermostabile Polymerasen wie 
beispielsweise Taq- Polymerase (GibcoBRL) , proHATM Polymerase 
(Eurogentech) . 

Polymerasen mit 3' -5* Exonuklease-Aktivitat konnen eingesetzt 
werden (z.B. Klenow- Fragment der E.coli-Polymerase I), sofern 
Reaktionsbedingungen gewahlt werden, die vorhandene 3'-5" 
Exonuklease-Aktivitat unterdrucken, wie z.B. ein niedriger pH- 
Wert (pH 6.5) beim Klenow-Fragment (Lehman and Richardson, J. 
Biol. Chem. 1964 v. 239 S.233) oder Zugabe von NaF zur 
Einbaureaktion. Eine andere Moglichkeit besteht in der 
Verwendung von NTs* mit einer Phosphorothioate-Verbindung 
(Kunkel et al. PNAS 1981, v. 78 S.6734). Dabei werden 
eingebaute NTs* von der 3' -5' Exonuklease-Aktivitat der 
Polymerase nicht angegriffen. Im folgenden werden all diese 
Polymerasearten als "Polymerase" bezeichnet. 
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4.5 Chemie 

4.5.1 Allgemeine NT-Struktur 

In den erf indungsgem&fien Verfahren konnen unterschiedliche 
NT*s verwendet werden (vorzugsweise 2 1 -deoxy-Nukleotid- 
Triphosphate) , die an ihrer 3 1 -Position des Riboseringes 
einen Substituenten tragen. Dieser Substituent kann alleine 
oder zusammen mit dem Fluoreszenzf arbstof f zur Termiantion 
der Einbaureaktion fiihren und kann unter milden Bedingngen 
vom Nukleotid abgespalten werden. An diesen Substituenten 1st 
ein fur das jeweilige NT* charakteristischer 
Fluoreszenzf arbstof f angekoppelt, so dass der Substituent 
auch die Rolle eines Linkers zwischen dem Nukleotid und dem 
Fluoreszenzf arbstof f ubernimmt. Der Fluoreszenzf arbstof f wird 
vorzugsweise an diesen Linker durch eine unter milden 
Bedingungen spaltbare Bindung angekoppelt . 

Unter ^milden Bedingungen" werden Spaltungsbedingungen 
verstanden, die weder zur Denaturierung des Primer- 
Nukleinsaure-Komplexes fiihren, noch zur Spaltung seiner 
einzelner Bestandteile . 

Formeln (1-3) stellen Beispiele fur die reversiblen 
spaltbaren Terminatoren dar: 

1) NT-3 1 -O-S (1) -F 

2) NT-3'-0-S(2)-N-F 

3) NT-3' -0-S(2) -N-L-F 

NT-3 ? -0 - stellt den 2 1 -Deoxy-Nukleosid-Triphosphat-Rest 
dar. 

S(l) - stellt einen Substituenten (Formel 1) dar, der 

unter milden Bidingungen vom NT* abgespalten werden kann. An 
diesen Substituenten ist ein Fluoreszenzf arbstof f (F) 
gekoppelt . 

S(2)-N - stellt einen weiteren Substituenten (Formel 2 und 
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3) dar, der unter milden Bidingungen vom NT* abgespalten 
werden kann. Dieser Substituent ist mit dem 
Pluoreszenzfarbstof f (F) durch eine unter milden Bedingungen 
spaltbare Gruppe (N) verbunden. Der Fluoreszenzfarbstof f kann 
unmittelbar an die spaltbare Gruppe (Formel 2) oder durch 
einem weiteren Linker (L) (Formel 3) gekoppelt sein. 

Beispiele fur NT*-Strukturen, NT*-Synthese, zur Polymerase- 
Wahl fur die Einbaureakiton , Reaktionsbedingungen der NT*- 
Einbaureakion und Abspaltungsreaktion sind in (Kwiatkoxski 
WO-Patent 01/25247, Kwiatkowski US-Patent 6.255.475, Conard 
et al. US-Patent 6.001.566, Dower (US Patent 5.547.839), 
Canard et al . (US Patent 5.798.210), Rasolonjatovo 
(Nucleosides & Nucleotides 1999, v. 18 S.1021), Metzker et al. 
(NAR 1994, v.22, S.4259), Welch et al. (Nucleosides & 
Nucleotides 1999, v. 18, S.197) beschrieben. 

4.5.2 Marker , Fluorophore 

Jedes Nukleotid ist mit einem charakteristischen Marker (F) 
markiert . Der Marker ist ein f luoreszierender Farbstoff. 
Die Wahl ist nicht eingeschrankt , sofern der Farbstoff 
folgenden Anf orderungen genugt : 

a) Die verwendete Detektionsapparatur muS diesen Marker als 
einziges Molekiil gebunden an DNA unter milden Bedingungen 
( vorzugsweise Reaktionsbedingungen) identif izieren konnen . 
Die Farbstoff e haben vorzugsweise groSe Photostabilitat . Ihre 
Fluoreszenz wird vorzugsweise von der DNA nicht oder nur 
unwesentlich gequencht. 

b) Der an das NT gebundene Farbstoff darf keine irreversible 
Stdrung der enzymatischen Reaktion verursachen. 

c) mit dem Farbstoff markierte NTs* mussen von der Polymerase 
in die Nukleinsaurekette eingebaut werden. 
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d) Bei einer Markierung mit verschiedenen Farbstoffen sollen 
diese Farbstoffe keine betrachtlichen Uberlappungen in ihren 
Emissionsspektren aufweisen. 

Beispielsweise sind einige Fluorophore, die im Rahmen der 
vorliegenden Erfindung verwendbar sind, in "Handbook of 
Fluorescent Probes und Research Chemicals" 6th ed. 1996, 
R.Haugland, Molecular Probes mit Strukturf ormeln 
zusammengestellt . Erf indungsgemaS werden vorzugsweise 
folgende Farbstof f klassen als Marker eingesetzt: Cyanln- 
Farbstoffe und deren Abkommlinge (z.B. Cy2, Cy3, Cy5, Cy7 
Amersham Pharmacia Biotech, Waggoner US-Patent 5.268.486), 
Rhodamine und deren Abkommlinge (z.B. TAMRA, TRITC, RG6, 
R110, ROX, Molecular Probes, s. Handbuch) , Xanthene-Derivate 
(z.B. Alexa 568, Alexa 594, Molecular Probes, Mao et al. US- 
Patent 6 . 130 . 101) und Porphyrine (Porphyrin- Systems, 
Deutschland) . Diese Farbstoffe sind kommerziell erhaltlich. 

Dabei kann man je nach spektralen Eigenschaften und 
vorhandener Apparatur entsprechende Farbstoffe auswahlen. Die 
Farbstoffe werden an das NT* fiber einen spaltbaren Linker 
gebunden. Die Farbstoffe konnen an den Linker z.B. uber 
Thiocyanat- oder Ester-Bindung gekoppelt werden ("Handbook of 
Fluorescent Probes und Research Chemicals" 6th ed. 1996, 
R.Haugland, Molecular Probes, Jameson et al . Methods in 
Enzymology 1997 v. 278 S.363, Waggoner Methods in Enzymology 
1995 v.246 S.362) 

4.5.3 Spaltbare Bindung zwischen dem Nukleotid und dem 
Substituenten, Spaltung . 

Der zur Termination fuhrende Substituent ist an das NT durch 
eine unter milden Bedingungen spaltbare Bindung gekoppelt. 
Beispiele fur diese Verbindungen stellen Ester und Acetale 
dar . 

Die Spaltung der Ester erfolgt vorzugsweise im basischen pH- 



WO 03/020968 PCT/EP02/09614 

37 



Bereich (z.B. 9 bis 11). Die Spaltung von Acetalen erfolgt im 
saueren Bereich (z.B. zwischen 3 und 4). 

Ester konnen auch enzymatisch durch Polymerasen oder Esterasen 
abgespalten we r den. 

In einer bevorzugten Ausfuhrungsform der Erfindung wird der 
Substituent zusammen mit dem Fluoreszenzf arbstof f in einem 
Schritt abgespalten. 

4.5.4 Spaltbare Bindung zwischen dem Substituenten und dem 
Fluoreszenzf arbstof f , Spaltung. 

In einer anderen bevorzugten Ausfuhrungsform der Erfindung ist 
der Fluoreszenzf arbstof f an den Substituenten durch eine unter 
milden Bedingungen spaltbare Gruppe gekoppelt. 

Vorzugsweise gehort die genannte Gruppe zu chemisch oder 
enzymatisch spaltbaren oder photolabilen Verbindungen . 
Ester-, Thioester-, Disulf id-Verbindungen und photolabile 
Verbindungen eignen sich besonders gut als spaltbare 
Verbindung zwischen dem Substituenten und dem 
Fluoreszenzf arbstof f . 

Als Beispiele von chemisch spaltbaren Gruppen sind Ester-, 
Thioester- und Disulf id-Verbindungen bevorzugt (^Chemistry of 
protein conjugation and crosslinking"" Shan S. Wong 1993 CRC 
Press Inc., Herman et al. Method in Enzymology 1990 v. 184 
S.584, Lomant et al. J.Mol.Biol. 1976 v. 104 243, "Chemistry of 
carboxylic acid and esters" S.Patai 1969 Interscience Publ.). 
Beispiele fur photolabile Verbindungen konnen in folgenden 
Literaturstellen gefunden werden: "Protective groups in 
organic synthesis" 1991 John Willey & Sons, Inc., V. Pillai 
Synthesis 1980 S.l, V. Pillai Org . Photochem . 1987 v. 9 S.225, 
Dissertation gNeue photolabile Schutzgruppen fur die 
lichtgesteuerte Oligonucleotidsynthese^ H. Giegrich, 1996, 
Konstanz, Dissertation gisreue photolabile Schutzgruppen fur die 
lichtgesteuerte Oligonucleotidsynthese" S.M.Biihler, 1999, 
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Konstanz) . 

Der Spaltungsschritt ist in jedem Zyklus vorhanden und mufi 
unter milden Bedingungen verlaufen, so dass die Nukleinsauren 
nicht beschadigt oder modifiziert werden. 

Die Spaltung lauft bevorzugt chemisch (z.B. in milder saurer 
oder basischer Umgebung fur eine Ester-Verbindung oder durch 
Zugabe eines Reduktionsmittels, z.B. Dithiothreitol oder 
Mercaptoethanol (Sigma) bei der Spaltung einer Disulfi'd- 
Verbindung) , oder physikalisch (z.B. durch Beleuchtung der 
Oberflache mit Licht einer bestimmten Wellenlange fur die 
Spaltung einer photolabilen Gruppe, Dissertation §Neue 
photolabile Schutzgruppen fur die lichtgesteuerte 
Oligonucleotidsynthese"" H. Giegrich, 1996, Konstanz) ab. 

In dieser Ausfuhrungsform wird nach der Detektion zunachst 
der Fluoreszenzf arbstof f abgespalten und erst dann der an die 
3 '-Position gekoppelte, zur Termination fuhrende Substituent. 

4.5.5 Farbiges Kodierungsschema, Anzahl der Farbstoffe 
Jedes NT* muS eindeutig mit einem charakteristischen 
Farbstoff markiert sein. Vorzugsweise kann man einen Zyklus 
durchf iihren mit : 

a) vier verschieden markierten NT*s 

b) zwei verschieden markierten NT*s 

c) einem markierten NT* 

d) zwei -verschieden markierten NT*s und zwei unmarkierten 
NTs, 

(auch andere Kombinationen soil ten einem Fachmann naheliegend 

erscheinen) 

d.h. 

a) Man kann alle 4 NTs mit verschiedenen Farbstoffen 
markieren und alle 4 gleichzeitig in die Reaktion einsetzten. 
Dabei erreicht man die Sequenzierung einer Nukleinsaurekette 
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mit einer minimalen Anzahl von Zyklen. Diese Variante der 
Erfindung stellt allerdings hohe Anf orderungen an das 
Detektionssystem: 4 verschiedene Farbstoffe miissen in jedem 
Zyklus identif iziert werden. 

b) Zur Vereinfachung der Detektion kann eine Markierung mit 
zwei Farbstoffen gewahlt werden. Dabei werden 2 Paare von 
NTs* gebildet, die jeweils verschieden markiert sind, z.B. A 
und G tragen die Markierung "X" , C und U tragen die 
Markierung "Y" . In die Reaktion in einem Zyklus (n) werden 2 
unterschiedlich markierte "NTs* gleichzeitig eingesetzt, z.B. 
C* in Kombination mit A*, und im darauf f olgenden Zyklus (n+1) 
werden dann U* und G* zugegeben. 

c) Man kann auch nur einen einzigen Farbstoff zur Markierung 
aller 4 NTs* verwenden und pro Zyklus nur ein NT* einsetzen. 

d) In einer technisch vereinf achten Ausf uhrungs form werden 
pro Zyklus zwei unterschiedlich markierte NT*s eingesetzt und 
zwei unmarkierte NTs (sogen. 2NT*s / 2NTs-Methode) . Diese 
Ausf iihrungsf orm kann verwendet werden, um Varianten (z.B. 
Mutationen, oder alternativ gespleifite Gene) einer bereits 
bekannten Sequenz zu ermitteln. 

Unter Reaktionsbedingungen erfolgt der Einbau von NT*s in die 
NSKFs vorzugsweise so, daS an mehr als 50% der an der 
Sequenzierungsreaktion beteiligten NSKFs in einem Zyklus ein 
markiertes NT* eingebaut wird, vorzugsweise an mehr als 90%. 
Das hangt damit zusammen, dafi an manchen Nukleinsaureketten 
die Reaktion sehr langsam ablauft. Ein Einbau der NTs* an 
jeder komplementaren Position in jedem Zyklus wird 
angestrebt, ist aber nicht erf orderlich, weil nur die 
erfolgreichen Einbaureaktionen detektiert und ausgewertet 
werden; eine verzogerte Reaktion im Nachf olgenden Zyklus 
fuhrt nicht zu einem Sequenzierungsf ehler . 

Vorzugsweise wird fur alle NTs* dieselbe Polymerase 
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verwendet . Es konnen aber auch verschiedene Polymerasen fur 
verschiedene NTs* eingesetzt werden. 

4 . 6 Detektionsapparatur 

Einzelne Molekule auf einer Oberflache kann man mit 
verschiedenen Methoden untersuchen . Es sind mehrere Verfahren 
bekannt : z . B . AtomForce-Mikroscopie, Elektronen-Mikroskopie, 
Nahfeld-Fluoreszenz-Mikroscopie, Weitfeld-Fluoreszenz- 
Mikroskopie, TIR-Mikroskopie usw. (Science 1999 v. 283 1667, 
Unger et al . BioTechniques 1999 v. 27 S.1008, Ishijaima et al. 
Cell 1998 v.92 S.161, Dickson et al. Science 1996 v. 274 S.966, 
Xie et al. Science 1994 v. 265 S.361, Nie et al. Science 1994 
v.266 S.1018, Betzig et al . Science 1993 v. 262 S.1422) . 

firf indungsgemafi werden Fluoreszenz-Signale einzelner in die 
Nukleinsaurekette eingebauter NTs* vorzugsweise mit einem 
Weitfeld-Fluoreszenz-Mikroskop (Epif luoreszenz) oder einem 
Laser-Scanning-Mikroskop (Epif luoreszenz) oder einem TIRF- 
Microskop (Total Internal Reflection Fluorescence Microscope) . 

Es sind verschiedene Varianten der Konstruktion einer solchen 
Apparatur moglich (Weston et al. J.Chem.Phys. 1998 v. 109 
S.7474, Trabesinger et al . Anal. Chem. 1999 v. 71 S.279, Adachi 
et al. Journal of Microscopy 1999 v. 195 S.125, Unger et al. 
BioTechniques 1999 v. 27 S.1008, Ishijaima et al. Cell 1998 
v.92 S.161, Dickson et al. Science 1996 v. 274 S.966, Tokunaga 
et al. Bichem.Biophys.Res.Com. 1997 v. 235 S.47, "Confocal 
Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific 
Publishers, "New Techniques of optical microscopy and 
microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., 
"Fluorescence microscopy" 1998 2.ed. Herman BIOS Scientific 
Publishers, "Handbook of biological confocal microscopy" 1995 
J.Pawley Plenum Press ). Unterschiede in ihrem konkreten 
Aufbau ergeben sich aus der Variation ihrer Einzelteile. Die 
Vorrichtung fur das Anregungslicht kann z.B. auf der Basis 
eines Lasers, einer Lampe oder von Dioden funktionieren. Fur 
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die Detektionsvorrichtung konnen sowohl CCD-Kameras als auch 
PMT dienen. Andere Beispiele fur technische Details siehe 
("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS 
Scientific Publishers, "New Techniques of optical microscopy 
and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., 
"Fluorescence microscopy" 1998 2.ed. Herman BIOS Scientific 
Publishers, "Handbook of biological confocal microscopy" 1995 
J.Pawley Plenum Press) . Es ist nicht die Aufgabe dieser 
Erfindung, alle moglichen technischen Varianten einer 
Detektionsvorrichtung aufzuzahlen. Der prinzipielle Aufbau 
einer geeigneten Apparatur wird in einem Schema Fig. 8 
erlautert. Sie besteht aus folgenden Elementen: 

Lichtquelle zur Anregung der Fluoreszenz (1) 
Lichtleitender Teil (2) 
Scantisch (3) 

Vorrichtung zur Selektion von Spektren (4) 
Detektionsvorrichtung (5) 

Computer mit Steuerungs- und Analysefunktionen (6) 

Diese Elemente der Apparatur konnen kommerziell erworben 
werden (Mikroskop-Firmen: Zeiss, Leica, Nikon. Olympus) . 

Im folgenden soil beispielsweise eine fur die Detektion 
einzelner Molekule geeignete Kombination aus diesen Elementen 
vorgestellt werden: 

Weitfeld-Fluoreszenz-Mikroskop Axioplan 2 (Zeiss) mit 
Que cksilber damp flampe 

Objektiv Planneofluar 100x, NA 1.4 (Zeiss) 
Kamera Photometrix oder AxioCam (Zeiss) 
Computer mit Software zur Steuerung und Analyse 

Nachfolgend soil die Vorgehensweise bei der Detektion 
erlautert werden. Man beachte dabei die allgemeinen Regeln der 
Fluoreszezmikroskopie ("Confocal Laser Scanning Microscopy" 
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1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques 
of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry 
CRC Press, Inc., "Fluorescence microscopy" 1998 2.ed. Herman 
BIOS Scientific Publishers, "Handbook of biological confocal 
microscopy" 1995 J.Pawley Plenum Press). 

Die Detektion umfaSt folgende Phasen: 

1) Vorbereitung zur Detektion 

2) Durchfuhrung eines Detektionsschrittes in jedem Zyklus, 
wobei jeder Detektionsschritt als Scanvorgang ablauft und 
folgende Operationen umfafct: 

a) Einstellung der Position des Objektivs (X,Y-Achse), 

b) Einstellung der Fokusebene (Z-Achse) , 

c) Detektion der Signale einzelner Molekiile, Zuordnung 
des Signals zu NT* und Zuordnung des Signals zum 
jeweiligen NSKF, 

d) Verschiebung zur nachsten Position auf der 
Oberf lache . 

Die Signale von in die NSKFs eingebauten NTs* werden durch das 
Abscannen der Oberf lache registriert. Der Scanvorgang kann in 
verschiedener Weise ausgefiihrt werden ("Confocal Laser 
Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific 
Publishers, "New Techniques of optical microscopy and 
microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., 
"Fluorescence microscopy" 1998 2.ed. Herman BIOS Scientific 
Publishers, "Handbook of biological confocal microscopy" 1995 
J.Pawley Plenum Press) . Beispielsweise wird ein 
diskontinuierlicher Scanvorgang gewahlt. Dabei wird das 
Objektiv schrittweise iiber die Oberflache bewegt (Fig. 8a) , so 
dass von jeder Oberf lachenposition ein zweidimensionales Bild 
(2D-Bild) entsteht (Fig 8b, c). 

Dieses 2D-Bild kann mit verschiedenen Methoden erstellt 
werden: z.B. durch den Laser-Scan einer Position des 
Mikroskopfeldes (Laser-Scanning-Microskopie) oder durch eine 
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Kameraaufnahme an einer Position (vgl. Handbiicher der 
Mikroskopie) . Als Beispiel wird die Detektion einzelner 
Molekiile mit einer CCD-Kamera beschrieben. 

Die Detektion wird schematised am Beispiel der Sequenzierung 
eines 1Mb langen DNA-Stucks erlautert: 

1) Vorbereitung zur Detektion: 

Am Anfang wird festgelegt, wie viele NSKF-Sequenzen zur 
Rekonstruktion der urspriinglichen Sequenz analysiert werden 
miissen. Im Fall einer Rekonstruktion nach dem Schrotschufi- 
Verfahren ("Automated DNA sequencing and analysis" S. 231 ff. 
1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 
1999 v.9 S.868, Huang Genomics 1996 v. 33 S.21, Bonfield et al. 

: NAR 1995 v. 23 S.4992, Miller et al. J. Comput . Biol . 1994 v.l 
S.257) spielen folgende Faktoren eine Roller 1) Von jedem NSKF 
wird bei der Sequenzierung eine Sequenz von ca. 300-500 NTs 
bestimmt. 2) Die Gesamtlange der zu analysierenden Sequenz ist 
wichtig. 3) Bei der Sequenzierung mufi ein bestimmtes MaS an 

i Redundanz erreicht werden, um die Genauigkeit zu steigem und 
eventuelle Fehler zu korrigieren. Insgesamt ist zur 
Rekonstruktion des groSten Teils der urspriinglichen Sequenz 
die etwa 10- bis 100-fache Menge an Rohsequenzen erf orderlich, 
d.h. bei diesem Beispiel mit einer Mb, werden 10 bis 100 Mb 
Rohsequenzdaten gebraucht. Bei einer durchschnittlichen 
Sequenzlange von 400 bp pro NSKF ben6tigt man entsprechend 
25.000 bis 250.000 DNA- Fragment e . 

2) Durchfiihrung eines Detektionsschrittes in jedem Zyklus 

Zur Sequenzierung miissen die Positionen der NSKFs bestimmt 
werden, damit man eine Grundlage fur die Zuordnung der Signale 
hat. Die Kenntnis dieser Positionen erlaubt eine Aussage 
dariiber, ob die Signale einzelner Molekiile von eingebauten 
NTs* stammen oder von zufallig an die Oberflache gebundenen 
NTs*. Diese Positionen konnen mit verschiedenen Methoden 
identif iziert werden. 
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In einer bevorzugten ' Ausfuhrungsf orm werden die Posit ionen 
gebundener NSKF-Primer-Komplexe wahrend der Sequenzierung 
identif iziert . Dabei wird die Tatsache genutzt, dass die 
Signale von den in die Nukleinsaurekette eingebauten NTs* 
immer dieselben Koordinaten haben. Das ist durch die Fixierung 
der Nukleinsaureketten gewahrleistet . Die unspezifisch 
gebundenen NTs* binden zufallig an verschieden Stellen der 
Oberf lache . 

Zur Identif izierung der Positionen von fixierten NSKFs werden 
die Signale auf Ubereinstimmung ihrer Koordinaten aus mehreren 
aufeinander folgenden Zyklen iiberpriift. Das kann z.B. am 
Anfang der Sequenzierung erfolgen. Die ubereinstimmende 
Koordinaten werden als Koordinaten der DNA- Fragment e bewertet 
und gespeichert. 

Das Scan-System mu£ reproduzierbar uber mehrere Zyklen die 
Oberf lache abscannen konnen. X,Y und Z-Achsen-Einstellungen an 
jeder Oberf lachenposition konnen von einem Computer 
kontrolliert werden. Stabilitat und Reproduzierbarkeit der 
Einstellung von Objektivpositionen in jedem Scanvorgang 
entscheiden uber die Qualitat der Detektion und somit iiber die 
Identif izierung der Signale einzelner Molekule. 

a) Einstellung der Position des Objektivs (X,Y-Achse) 

Die mechanische Instability der kommerziell erhaltlichen 
Scant ische und die geringe Reproduzierbarkeit der wiederholten 
Einstellung derselben X, Y-Positionen machen eine prazise 
Analysen der Signale einzelner Molekule uber mehrere Zyklen 
schwierig. Es exist ieren viele Moglichkeiten, eine 
Ubereinstimmung der Koordinaten bei wiederholten Einstellungen 
zu verbessern bzw. mogliche Abweichungen zu kont roll ieren. Als 
Beispiel wird eine Kontrollmoglichkeit angefiihrt. Nach einer 
groben mechanischen Einstellung der Objektivposition wird ein 
Kontrollbild von einem mit der Oberflache fest verbundenen 
Muster gemacht. Auch wenn die mechanische Einstellung nicht 
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exakt dieselben Koordinaten aufweist (Abweichungen bis zu 10 
jam sind durchaus moglich) , kann man mittels optischer 
Kontrolle eine Korrektur vornehmen. Das Kontrollbild vom 
Muster dient als Koordinatensystem fur das Bild mit Signalen 
von eingebauten NTs* . Eine Voraussetzung fur eine solche 
Korrektur ist, dass keine weiteren Bewegungen der Oberflache 
zwischen diesen beiden Aufnahmen gemacht werden. Signale von 
einzelnen Molekulen werden in Relation zum Muster gesetzt, so 
dass eine X, Y-Abweichung in der Musterposition gleiche X,Y- 
Abweichung in der Position der Signale einzelner Molekule 
bedeutet. Das Kontrollbild vom Muster kann vor, wahrend oder 
nach der Detektion einzelner Molekule gemacht werden. Ein 
solches Kontrollbild mu& entsprechend bei jeder Einstellung 
auf einer neuen Oberf lachenposition .gemacht werden. 

b) Einstellung der Fokusebene (Z-Achse) 

Die Oberflache ist nicht absolut plan und weist verschiedene 
Unebenheiten auf. Dadurch verandert sich der Oberf lache-Objek- 
tiv-Abstand beim abscannen benachbarter Stellen. Diese Unter- 
schiede im Abstand konnen dazu fiihren, dass einzelne Molekule 
die Fokusebene verlassen und so der Detektion entgehen. 

Aus diesem Grund ist es wichtig, dass beim Abscannen der Ober- 
flache eine reproduzierbare Einstellung der Fokusebene an 
jeder Objektivposition erreicht wird. 

Es gibt verschiedene Moglichkeiten, die Fokusebene 
reproduzierbar einzustellen. Beispielsweise kann folgende 
Methode angewendet werden: Da die Anregung einzelner Molekule 
zum Ausloschen ihrer Fluoreszenz fiihren kann, wird auf die 
Oberflache ein Marker aufgebracht, der zur Einstellung der 
Fokusebene dient. Danach erfolgt die Detektion der Signale 
einzelner Molekule. Der Marker kann beliebiger Natur sein 
(z.B. Farbstoff oder Muster), darf aber die Detektion und die 
Reaktion nicht beeintrachtigen. 
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c) Detektion der Signale einzelner Molekule, Zuordnung des 
Signals zu NT* und Zuordnung des Signals zum jeweiligen NSKF. 

Das mit Hilfe des Detektionssystems erzeugte zweidimensionale 
Bild der Reaktionsoberf lache enthalt die Signalinf ormationen 
von in die NSKFs eingebauten NT*s. Diese tmissen vor der 
weiteren Verarbeitung aus der Gesamtdatenmenge der 
Bildinformationen mit geeigneten Methoden extrahiert werden. 
Die dazu notwendigen Algorithmen zur Skalierung, 
Transformation und Filterung der Bildinformationen zahlen zum 
Standardrepertoir der digitalen Bildverarbeitung und 
Mustererkennung (Haberacker P. "Praxis der Digitalen 
Bildverarbeitung und Mustererkennung". Hanser-Verlag, Munchen, 
Wien, 1995; Galbiati L.J. "Machine vision and digital image 
processing fundamentals". Prentice Hall, Englewood Cliffs, New 
Jersey, 1990) . Die Signalextraktion erfolgt vorzugsweise uber 
ein Grauwertbild, das die Helligkeitsverteilung der Reaktions- 
oberf lache fur den jeweiligen Fluoreszenzkanal abbildet. Wenn ( 
bei der Sequenzierungsreaktion mehrere Nukleotide mit 
unterschiedlichen Fluoreszenz-Farbstof f en verwendet werden, 
kann zunachst fur jedes verwendete f luoreszenzmarkierte 
Nukleotid (A,T,C,G oder U) ein separates Grauwert-Bild erzeugt 
werden. Dafiir konnen prinzipiell 2 Verfahren angewendet 
werden : 

1. Durch Verwendung von geeigneten Filtern (Zeiss-Filtersatze) 
wird fur jeden Fluoreszenzkanal ein Grauwertbild erzeugt. 

2 . Aus einem auf genommenen Mehrkanal-Farb-Bild werden mit 
Hilfe eines geeigneten Algorithmus durch ein 
Bildverarbeitungsprogramm die relevanten Farbkanale extrahiert 
und jeweils als Grauwertbild einzeln weiterverarbeitet . Zur 
Kanalextraktion wird dabei ein fur den jeweiligen Kanal 
spezif ischer Farb-Schwellwertalgorithmus eingesetzt . So 
entstehen zunachst aus einem Mehrkanal-Farbbild einzelne 
Grauwertbilder 1 bis N. Diese Bilder definieren sich wie 
f olgt : 
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GB N = (s(x,y)) 
N={l, . . . ,Anzahl 
M={0,1, . . . ,255} 
S=(s(x,y) ) 
x=0, 1, . . . ,L-1 
y«0, 1, . . . ,R-1 
(x,y) 

s(x / y) e M 



der Fluoreszenzkanale} . 
Grauwertmenge 

Bildmatrix des Grauwertbildes 



Bildspalten 

Ortskoordinaten eines Bildpunktes 
Grauwert des Bildpunktes. 



Bildzeilen 



einkanaliges Grauwertbild 



Aus dieser Datenmenge wird nun durch ein geeignetes Programm 
die relevante Bildinformation extrahiert. Ein solches Programm 
sollte folgende Arbeitsschritte realisieren: 

Fur GB t bis GB N durchfiihren: 

I. Vorverarbeitung des Bildes, so zum Beispiel gegebenenf alls 
Reduktion des durch die Digit alisierung der Bildinformation 
entstandenen Bildrauschens, etwa durch Grauwertglattung. 

II. Priifung jedes Bildpunkt (x,y) des Grauwertbildes, ob 
dieser Punkt im Zusammenhang mit den ihn umgebenden 
unmittelbaren und weiter entfernten Nachbarbildpunkten die 
Eigenschaf ten eines Fluoreszenzpunktes erf iillt . Diese 
Eigenschaf ten hangen unter anderem von der verwendeten 
Detektionsapparatur und der Auflosung des Grauwertbildes ab. 
Sie konnen beispielsweise ein typisches Verteilungsmuster von 
Helligkeits-Intensitatswerten iiber einer den Bildpunkt 
umgebenden Matrix darstellen. Die dazu verwendbaren Methoden 
der Bildsegmentierung reichen von einfachen Schwellwert- 
verfahren bis hin zur Verwendung neuronaler Netze. 

Erf iillt ein Bildpunkt (x,y) diese Anf orderungen, dann folgt 
ein Vergleich mit den Koordinaten von in bisher durchgefuhrten 
Sequenzierungszyklen identif izierten NSKFs. Bei einer Uber- 
einstimmung erfolgt die Zuordnung des Signals mit dem aus dem 
jeweiligen Fluoreszenzkanal hervorgehenden Nukleotid zu diesem 
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NSKF. Signale mit nicht ubereinstimmenden Koordinaten werden 
als Hintergrundsignale bewertet und verworfen. Die Analyse der 
Signale kann parallel zum Scanvorgang erfolgen. 

In einer beispielhaf ten Ausfiihrung wurde ein 
8-Bit-Grauwertbild mit einer Auflosung von 1317 x 1035 Pixel 
verwendet. Urn die durch die Digitalisierung entstandenen 
Veranderungen am Bild zu reduzieren, erfolgte zunachst eine 
Vorverarbeitung des Gesamtbildes : Jedem Bildpunkt wurde der 
Mittelwert der Helligkeiten seiner 8-Nachbarn zugewiesen. Bei 
der gewahlten Auflosung entsteht dadurch ein fur einen 
Fluoreszenzpunkt typisches Muster eines zentralen Bildpunkt 
mit dem grSSten Helligkeitswert und Nachbarbildpunkten mit 
nach alien Seiten hin abfallenden Helligkeiten. Erfullte ein 
Bildpunkt diese Kritierien und Uberschritt der zentrifugale 
Helligkeitsabf all einen bestimmten Schwellenwert (zur 
Exklusion zu schwacher Fluoreszenzpunkte) , dann wurde dieser 
zentrale Bildpunkt als Koordinate eines Fluoreszenzpunktes 
gewertet . 

d) Verschiebung des Objektivs zur nachsten Position auf der 
Oberf lache . Nach der Detektion der Signale einzelner Molekule 
wird das Objektiv iiber einer anderen Position der Oberf lache 
positioniert . 

Insgesamt kann beispielsweise eine Folge von Aufnahmen mit der 
Kontrolle der X, Y-Position, der Einstellung der Fokusebene und 
mit der Detektion einzelner Molekule bei jeder neuen Objek- 
tivposition gemacht werden. Diese Schritte konnen durch einen 
Computer gesteuert werden. 

4.7 Zeitlicher Ablauf der Verf ahrensschritte 

Der Scanvorgang sowie die biochemische Reaktion nehmen eine 
gewisse Zeit in Anspruch. Wenn man diese Vorgange nacheinander 
schaltet, kann man eine optimale Leistung der Apparatur errei- 
chen. In einer bevorzugten Ausfiihrung wird die Reaktion auf 



WO 03/020968 



49 



PCTVEP02/09614 



zwei getrennten Oberflachen durchgef uhrt . 

Als Beispiel kann eine Oberflache mit gebundenen NSKF-Primer- 
Komplexen in 2 raumlich isolierte Teile getrennt werden, so 
dass Reaktionen auf diesen beiden Teilen unabhangig 
voneinander ablaufen konnen. In einem anderen Beispiel kdnnen 
NSKFs auch von vornherein auf 2 getrennten Oberflachen 
immobilisiert werden. 

Danach wird die Reaktion gestartet. Das Prinzip dabei ist, 
dass wahrend auf einem Teil der Oberflache die Reaktions- und 
Waschschritte ablaufen, der zweite Teil abgescannt wird. 
Dadurch kann man einen kontinuierlichen Ablauf der Analyse 
erreichen und die Geschwindigkeit der Sequenzierung steigern. 

Die Anzahl der Oberflachen, auf denen die Reaktion ablauf t, 
kann auch groSer als 2 sein. Das erscheint dann sinnvoll, wenn 
die Reaktion als zeitlich limitierender Schritt auftritt, d.h. 
die Detektion der Signale auf der Oberflache schneller als die 
Reaktions- und Waschschritte ablauf t. Urn die Gesamtdauer der 
Reaktion an die Detektionsdauer anzupassen, kann jeder 
einzelne Schritt der Reaktion auf einer einzelnen Oberflache 
mit einer zeitlichen Verzogerung im Vergleich zur nachsten 
Oberflache ablaufen. 

Die Erfindung wird nachfolgend anhand von Beispielen verdeut- 
licht. 



WO 03/020968 



50 



PCI7EP02/09614 



Beispiele 

Beis piel 1; 

Sequenzanalyse mit 4 markierten NTs* 

Bei einer bevorzugten Ausfuhrungsform der Erfindung werden 
alle vier in die Reaktion eingesetzten NTs* mit Fluoreszenz- 
f arbstof fen markiert. 

1A. Rekonstruktion der urspriinglichen Sequenzen nach dem 
SchrotschuS- Prinzip ("Automated DNA sequencing and 
analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, 
Huang et al. Genom Res. 1999 v. 9 S.868, Huang Genomics 
1996 v.33 S.21, Bonfield et al. NAR 1995 v. 23 S.4992, 
Miller et al. J . Comput . Biol . 1994 v.l S.257) . (Dieses 
Prinzip ist insbesondere bei der Analyse neuer, unbekann- 
ter Sequenzen geeignet . ) 

lA-lSequenzierung eines langen DNA-Stucks 

Im folgenden soil anhand der Sequenzierung eines 1Mb 
langen DNA-Stuckes schematise}! die Sequenzierung langer 
Nukleinsaureketten dargestellt werden (Fig. 1) . Der 
Sequenzierung liegt das Shotgun- Prinzip zugrunde 
("Automated DNA sequencing and analysis" S. 231 ff. 1994 
M. Adams et al. Academic Press, Huang et al. Genom Res. 
1999 v.9 S.868, Huang Genomics 1996 v.33 S.21, Bonfield et 
al. NAR 1995 v.23 S.4992, Miller et al. J . Comput . Biol . 
1994 v.l S.257). Das zu analysierende Material wird fur 
die Sequenzierungsreaktion vorbereitet, indem es in 
Fragment e von vorzugsweise 50 bis 1000 bp Lange zerlegt 
wird. Jedes Fragment wird anschlieSend mit einer 
Primerbindungsstelle und einem Primer versehen. Dieses 
Gemisch aus verschiedenen DNA-Fragmenten wird nun auf 
einer planen Oberflache fixiert. Die nicht gebundenen DNA- 
Fragmente werden durch einen Waschschritt entfernt. Danach 
wird die Sequenzierungsreaktion an der gesamten Reaktions- 
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oberflache durchgef uhrt . Zur Rekonstruktion einer 1 Mb 
langen DNA- Sequenz sollten die Sequenzen von NSKFs 
vorzugsweise langer als 300 NTs sein, durchschnittlich ca. 
400 bp. Da pro Zyklus nur jeweils ein markiertes NT* 
eingebaut wird, sind mindestens 400 Zyklen zur 
Sequenzierung notwendig. 

Insgesamt ist zur Rekonstruktion der ursprunglichen 
Sequenz die etwa 10- bis 100 -f ache Menge an Rohsequenzen 
erforderlich, d.h. 10 bis 100 Mb. Bei einer 
durchschnittlichen Sequenzlange von ca. 400 bp pro NSKF 
bendtigt man entsprechend 25.000 bis 250.000 DNA- 
Fragmente, urn mehr als 99,995% der Gesamtsequenz 
abzudecken . 

Die ermittelten NSKF- Sequenzen stellen eine Population von 
uberlappenden Teilsequenzen dar, die sich mit kommerziell 
erhaltlichen Programmen zur Gesamtsequenz der NSK 
zusammenfugen lassen ("Automated DNA sequencing and 
analysis" S. 231 ff. 1994 M. Adams et al . Academic Press , 
Huang et al. Genom Res. 1999 v. 9 S.868, Huang Genomics 
1996 v. 33 S.21, Bonfield et al . NAR 1995 v. 23 S.4992, 
Miller et al. J.Comput .Biol. 1994 v.l S.257). 

1A- 2 Sequenzierung der Genprodukte am Beispiel der cDNA-Sequen- 
zierung 

In einer bevorzugten Ausfuhrungsform kdrmen statt einer 
Sequenz mehrere Sequenzen in einem Ansatz analysiert 
werden. Die ursprunglichen Sequenzen konnen aus den 
gewonnen Rohdaten z.B. nach dem SchrotschuS-Prinzip 
rekonstruiert werden. 

Zunachst werden NSKFs erzeugt. Man kann z.B. mRNA in eine 
doppelstrangige cDNA iiberfuhren und diese cDNA mit Ul- 
traschall f ragmentieren. AnschlieSend werden diese NSKFs 
mit einer Primerbindungsstelle versehen, denaturiert, 
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immobilisiert und' mit einem Primer hybridisiert . Zu 
beachten ist bei dieser Variante der Probenvorbereitung, 
dass die cDNA-Molekule unvollstandige mRNA-Sequenzen 
darstellen konnen (Method in Enzymology 1999, v. 303, S.19 
und andere Artikel in diesem Band, " cDNA library 
protocols" 1997 Humana Press) . 

Eine andere Moglichkeit bei der Generierung 
einzelstrangiger NSKFs von mRNA besteht in der reversen 
Transkription der mRNA mit randomisierten Primern. Dabei 
werden viele relativ kurze antisense DNA-Fragmente 
gebildet (Zhang- J et al. Biochem.J. 1999 v. 337 S.231, 
Ledbetter et al . J.Biol. Chem. 1994 v. 269 S. 31544, Kolls et 
al. Anal.Biochem. 1993 v. 208 S.264, Decraene et al. 
Biotechniques 1999 v. 27 S.962). Diese Fragmente konnen 
anschlieSend mit einer Primerbindungs telle versehen werden 
(s.o). Weitere Schritte entsprechen oben beschriebenen 
Vorgangen. Mit dieser Methode konnen komplette mRNA- 
Sequenzen (vom 5'- bis zum 3'-Ende) analysiert werden, da 
die randomisierten Primer uber die gesamte Lange der mRNA 
binden . 

Immobilisierte NSKFs werden mit einer der oben angefuhrten 
Ausfuhrungsformen der Sequenzierung analysiert. Da mRNA- 
Sequenzen wesentlich weniger repetitive Sequenzen 
aufweisen als z.B. genomische DNA, kann die Anzahl der 
detektierten Signale der eingebauten NTs* von einem NSKF 
geringer als 3 00 sein und liegt vorzugsweise zwischen 20 
und 1000. Die Anzahl der NSKFs, die analysiert werden 
mussen, errechnet sich nach denselben Prinzipien wie bei 
einer SchrotschuS-Rekonstruktion einer langen Sequenz. 

Aus NSKF-Sequenzen werden nach den Prinzipien des Schrot- 
schuS-Verfahrens die urspriinglichen Gensequenzen rekon- 
struiert . 

Diese Methode erlaubt die gleichzeitige Sequenzierung von 
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vielen mRNAs ohne vorherige Klonierung. 

. Analyse von Sequenzvarianten 

Die Bestatigung einer bereits bekannten Sequenz oder der 
Nachweis von Varianten dieser Sequenz stellt sehr viel 
geringere Anspriiche an die Lange und Redundanz der 
ermittelten NSKF-Sequenzen. Auch die Sequenzbearbeitung 
ist in diesem Fall einfacher. Die Vollsequenz braucht 
nicht neu rekonstruiert zu werden. Die NSKF-Sequenzen 
werden vielmehr mit Hilfe eines kommerziell erhaltlichen 
Programms der Vollsequenz zugeordnet und eventuelle 
Abweichungen detektiert. Einem solchen Programm kann z.B. 
BLAST oder FASTA Algorithmus zugmnde liegen 
("Introduction to computational Biology" 1995 M.S. 
Waterman Chapman & Hall) . 

Die zu analysierende Sequenz wird mit einer der oben 
genannten Methoden in NSKFs iiberf iihrt . Diese NSKFs werden 
mit dem erf indungsgemaSen Verfahren sequenziert, wobei man 
sowohl einen einheit lichen Primer und eine einheitlihe 
Primerbindungsstelle als auch unterschiedliche, 

sequenzspezif ische Primer und naturliche, in der zu 
un t e r sue henden Ge s amt s e quenz vorkommende 

Primerbindngsstellen verwenden kann. AnschlieSend werden 
die ermittelten Sequenzen von NSKFs nicht nach dem Schrot- 
schuS- Verfahren zusammengestzt , sondern mit der Referenz- 
sequenz verglichen und auf diese Weise ihren Positionen in 
der Vollsequenz zugeordnet. Dabei kann es sich urn 
genomische oder cDNA- Sequenzen handeln. 

Im Gegensatz zu einer Rekonstruktion nach dem SchrotschuS- 
Verfahren braucht man fur die Analyse einer 
Sequenzvariante erheblich weniger Rohsequenzdaten. So kann 
die 5- bis 10- fache Rohsequenzmenge ausreichend fiir die 
Wiederherstellung einer neuen Variante einer Vollsequenz 
sein. Mit dem SchrotschuS- Verfahren wird fiir eine 
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Wiederherstellung " eine 10- bis 100-fache Menge an 
Rohsequenzen benotigt ( "Automated DNA sequencing and 
analysis" S. 231 ff. 1994 M. Adams et al . Academic Press, 
Huang et al. Genom Res. 1999 v. 9 S.868, Huang Genomics 
1996 v.33 S.21, Bonfield et al. NAR 1995 v. 23 S.4992, 
Miller et al. J. Comput .Biol . 1994 v.l S.257) . 

Die Lange der ermittelten NSKF-Sequenzen soli fur eine 
eindeutige Zuordnung zu einer bestimmten Position in der 
Referenzsequenz ausreichend sein, so konnen z.B bereits 
Sequenzen mit einer Lange von 20 NTs (z.B. aus nicht 
repetitiven Abschnitten im menschlichen Genom) eindeutig 
identifiziert werden. Fur die Vergleichsanalyse der repet- 
itiven Abschnitte werden langere Sequenzen benotigt. Die 
genaue Lange der Sequenzen hangt dabei von der Aufgaben- 
stellung ab. Vorzugsweise betragt die Lange der ermittel- 
ten NSKF-Sequenzen bei der Analyse von nicht repetitiven 
Abschnitten mehr als 20 NTs. Fur die Analyse der 
repetitiven Abschnitte liegt sie vorzugsweise uber 500 
NTs. 

Die Zielsetzungen bei der Sequenzierung neuer Varianten 
einer bereits bekarmten Vollsequenz konnen sehr unter- 
schiedlich sein. Meist wird ein Vergleich der neu 
ermittelten Sequenz mit der bekannten 

Vollsequenz/Ref erenzsequenz angestrebt. Dabei konnen die 
beiden Sequenzen aus evolutionar unterschiedlich weit aus- 
einanderliegenden Spezies stammen. Verschiedene Parameter 
der Zusammensetzung dieser beiden Sequenzen konnen 
verglichen werden. Als Beispiele fur eine solche Analyse 
dienen: Mutations- oder Polymorphismusanalysen und die 
Analyse von alternativ gespleifcten Genprodukten. 

Nachfolgend soli schematisch und beispielhaft ein 
Vergleich der zu untersuchenden Sequenz mit einer 
Referenzsequenz ohne vorherige Rekonstruktion der zu 
analysierenden Sequenz betrachtet werden. Ein solcher 
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Vergleich kann z'.B. zur Mutations- oder SNP-Analyse 
dienen . 

1B-1 

Eine lange, zu analysierende Sequenz, z.B. 1 Mb, wird in 
NSKFs mit einer der oben genannten Methode geteilt. Diese 
NSKFs werden unter Verwendung einheitlicher Primer mit dem 
erf indungsgemaSen Verf ahren sequenziert . Die ermittelten 
Sequenzen von jedem einzelnen NSKF werden direkt mit der 
Referenzsequenz verglichen. Die Ref erenzsequenz dient 
dabei als Grundlage fur die Zuordnung ermittelter NSKF- 
Sequenzen, so dass die aufwendige Rekonstruktion nach dem 
SchrotschuS-Verf ahren entfallt. Vorzugsweise betragt die 
Lange der ermittelten NSKF - Sequenzen bei der Analyse von 
nicht-repetitiven Abschnitten mehr als 20 NTs. Fur die 
Analyse der repetitiven Abschnitte liegt sie vorzugsweise 
fiber 500 NTs. Die Anzahl der zu analysierenden NSKFs 
richtet sich dabei nach der Gesamtlange der zu 
untersuchenden Sequenz, der durchschnitt lichen Lange der 
NSKF- Sequenzen und der notwendigen Genauigkeit der Sequen- 
zierung. Bei einer durchschnittlichen Lange der 
ermittelten NSKF-Sequenz von 100 NTs, einer Gesamtlange 
der zu untersuchenden Sequenz von 1 Mb und einer 
Genauigkeit, die der Rohsequenzermittlung entspricht (d.h. 
jede Stelle soli moglichst nur einmal sequenziert werden) 
benotigt man z.B. die ca. 5- f ache Menge an Rohsequenzen, 
d.h. 5 Mb, weil die Verteilung der NSKFs uber die 
Gesamtsequenz zufallig erf olgt . Insgesamt miissen 50.000 
NSKFs analysiert werden, urn mehr als 99% der Gesamtstrecke 
abzudecken. 

AnschlieSend werden die ermittelten NSKF -Sequenzen mit 
Hilfe eines kommerziell erhaltlichen Programms der 
Vollsequenz zugeordnet und eventuelle Abweichungen 
detektiert. Einem solchen Programm kann z.B. BLAST oder 
FASTA Algorithmus zugrunde liegen ("Introduction to 
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computational Biology" 1995 M.S. Waterman Chapman & Hall) . 
Beispiel 2: 

Sequenzanalyse mit 2 markierten NTs* und 2 unmarkierten NTs 
(2NTs* / 2NTs-Methode) . 

In einer anderen Ausfuhrungsform werden fur die. Analyse der 
Sequenzen 2 modifizierte NTs* und 2 unmodif izierte NTs einge- 
setzt . 

Diese Methode eignet sich besonders zur Analyse der Sequenzva- 
rianten (z.B. SNP- oder Mutationsanalyse) und setzt die 
Kenntnis einer Ref erenzsequenz voraus . Dabei wird die 
Vollsequenz nicht rekonstruiert , sondern die ermittelten 
Sequenzen werden mit Hilfe eines Programms der Ref erenzsequenz 
zugeordnet und eventuelle Abweichungen registriert. Einem 
solchen Programm kann z.B. der BLAST oder FASTA Algorithmus 
zugrunde liegen ("Introduction to computational Biology" 1995 
M.S. Waterman Chapman & Hall) . 

Diese Ausfuhrungsform beruht auf dem Prinzip, dass eine 
Abfolge aus 2 Signalen (markierte NT's) genugend Inf ormationen 
zur Identif izierung einer Sequenz enthalten kann. Die 
ermittelte Sequenz wird mit der Ref erenzsequenz verglichen und 
einer bestimmten Position zugeordnet, z.B. : 

ACCAAAACACCC - ermittelte Sequenz (dCTP* und dATP* sind 
markiert) 

ATCATCGTTCGAAATATCGATCGCCTGATGCC - Ref erenzsequenz 

A-C---C-AAA-A-C-A-C-CC (zugeordnete ermittelte Sequenz) 
ATCATCGTTCGAAATATCGATCGCCTGATGCC (Ref erenzsequenz ) 



WO 03/020968 



57 



PCT/EP02/09614 



Die unbekannte, zu analysierende Variante der Ref erenzsequenz 
wird wie oben beschrieben zur Sequenzierung vorbereitet (NSK 
wird in NSKFs uberfuhrt, diese werden mit PBS ligiert, 
anschliefiend mit einem Primer hybridisiert und auf 
Reaktionsoberf lache immobilisiert) . Auf diese Weise 
vorbereitete NSKFs werden mit 2NTs*/2NTs-Methode sequenziert. 
Man erhalt NSKF-Sequenzen, wobei jede NSKF-Sequenz eine 
Abfolge aus 2NTs* darstellt. Urn eine eindeutige Zuordnung der 
ermittelten Sequenz zu einer bekannten Ref erenzsequenz zu 
ermoglichen, muB diese Abfolge lang genug sein. Vorzugsweise 
betragt die Lange der ermittelten NSKF-Sequenzen mehr als 40 
NT*s. Da 2 markierte NTs* nur einen Teil der Sequenz 
ciarstellen, ist die Gesamtlange des synthetisierten 
komplementaren Strangs ca. doppelt so lang, wie die Abfolge 
der detektierten NTs* (bei 40 detektierten NTs* betragt die 
Gesamtlange z.B, durchschnittlich 80 NTs) . 

Zur Synthese eines komplementaren Stranges werden 4 Nukleotide 
benotigt. Da die mit einem Fluoreszenzf arbstof f markierten 
NTs* in der vorliegenden Erfindung als Semiterminatoren 
auftreten, d.h. die Termination ausschlielSlich bei 
Verfiigbarkeit modif izierter NTs* auftritt, mtissen 
unmodif izierte NTs in einem zusatzlichen Schritt in jedem 
Zyklus in die Reaktion zugegeben werden. Die genaue Position 
dieses Schrittes in dem Zyklus kann variieren. Wichtig dabei 
ist, dass die markierten NTs* und die unmodif izierte NTs 
getrennt verwendet werden. 

Ein Zyklus bei dieser Ausfuhrungsform kann beispielhaft 
folgendermafien aussehen: 

a) Zugabe einer Losung mit modif izierten NTs* und Polymerasen 
auf die Oberflache mit den bereitgestellten NSKFs 

b) Inkubation der immobilisierten Nukleinsaureketten mit 
dieser Losung unter Bedingungen, die zur Verlangerung der 
komplementaren Strange urn ein NT geeignet sind 

c) Waschen 
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d) Detektion der Signale von einzelnen, modif izierten und in 
die den NSKFs komplementaren neusynthetisierten Strangen 
eingebauten NTs'-Molekiilen 

e) Entfernung der Markierung und der terminierenden Gruppe 
bei den eingebauten Nukleotiden 

f) Waschen 

g) Zugabe von 2 unmodif izierten NTs und Polymerasen 

h) Waschen . 

Diese 2NT*s/2NTs-Methode eignet sich beispielsweise fur die 
SNP-Analyse einer genomischen Strecke eines Gens oder fur 
doppelstrangige cDNA-Analyse . Ihr liegen folgende Prinzipien 
zugrunde : 

1) Die genetische Information in jedem der beiden kom- 
plementaren DNA-Strange ist identisch, so dass fehlende 
Informationen in einem Strang durch die Information aus 
dem anderen Strang vervollstandingt werden konnen. 

2) Durch bestimmte Paarkombinationen markierter NTs* kann man 
mit nur 2 NTs* die komplette Information aus einer doppel- 
strangigen DNA erhalten. Zulassige Kombinationen von NT's 
bei dieser Aus fuhrungs form sind: A*C*; A*G* ; C*T*/C*U*; 
G*T*/G*U*. Bevorzugt wird die Kombination C* und U*. 

3) Als Grundlage der Analyse dient eine bereits bekannte 
Ref erenzsequenz . 

4) Die NSKFs stammen von beiden Strangen der zu 
analysierenden NSK und • die ermittelten NSKF-Sequenzen 
decken die gesamte Lange der zu analysierenden Sequenz ab. 

Am folgenden Beispiel wird erklart, wie die Information aus 
einem doppelstrangigen DNA-Fragment mit nur 2 markierten NTs* 
gewonnen wird und wie die Unterschiede zur ursprunglichen oder 
nicht mutierten Sequenz (Ref erenzsequenz / Vergleichsequenz) 
festgestellt werden konnen. Sequenzen unter (1) und (2) sind 
bis auf eine Stelle identisch (unterstrichen) . A* und C* sind 
markiert . 
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1) zu priifende Sequenz : 

Die zu priifende Sequenz wird mit 2NT*s/2NTs-Methode 
sequenziert, so dass eine Population an NSKF-Sequenzen 
(ermittelte NSKF-Sequenzen (n) ) entsteht. Diese ermittelten 
NSKF-Sequenzen enthalten Information von jedem Strang: 

5 'A-C C-AAA-A-C-A-C-CC3 » - ermittelte NSKF - Sequenz (i) 

5 1 ATCGTTCGAAATATCGATCGCCTG3 1 
3 • TAGCAAGCTTTATAGCTAGCGGAC5 » 

3' A-CAA-C---A-A-C-A-C---C5 1 - ermittelte NSKF -Sequenz (i+1) 

2 ) Vergleichsequenz : 

Zur Analyse ist eine Vergleichsequenz ( Re ferenz sequenz) 
erforderlich: 

5 1 ATTGTTCGAAATATCGATCGCCTG3 1 
3 1 TAACAAGCTTTAT AGCTAGCGGAC 5 1 

3) Vergleichsequenz mit angepaSten ermittelten NSKF-Sequenzen: 

Mit Hilfe eines Programms werden ermittelte NSKF-Sequenzen 
bestimmten Stellen in der Vergleichsequenz zugeordnet und 
eventuelle Abweichungen detektiert: 

5 'A-C C-AAA-A-C-A-C-CC3 1 - ermittelte NSKF-Sequenz (i) 

5 1 ATTGTTCGAAATATCGATCGCCTG3 1 
3 ■ TAACAAGCTTTATAGCTAGCGGAC5 ' 

3 ' A-CAA-C A-A-C-A-C C5 ' - ermittelte NSKF-Sequenz (i+1) 

ft 

(Einzelnukleotidmutation) 

Mit dieser Ausfiihrungsform kann man eine doppelstrangige 
Nukleinsaure auf SNP oder Mutationen untersuchen. Dabei werden 
die ermittelten NSKF-Sequenzen mit einer Ref erenzsequenz 
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verglichen. Die Grundregeln des Vergleichs einer Teilsequenz 
und einer kompletten Sequenz bei der Analyse mit nur 2 
markierten NTs unterscheiden sich nicht prinzipiell von denen, 
die bei dem Vergleich der Sequenzen anhand aller 4 markierten 
NTs* gelten. Naheres s. Sequenzvergleich bei Mutationsanalyse 
und SNP-Analyse mit 4NTs* (Beispiel IB) . 

Beispiel 3 : Analyse der Genexpression 

Die Grundprinzipien der Sequenzierungsreaktion bei der 
Genexpressionsanalyse entsprechen denen der 

Sequenzierungsreaktion langer NSKs (Fig. 7). Die 
Grundprinzipien zur Durchfuhrung eines Reaktionszyklus (die 
Wahl der NT*-Struktur, der Polymerase, der 

Reaktionsbedingungen fur die NT*-Einbaureaktion und die 
Abspaltungsreaktion) , sowie zur Detektion der Signale von 
eingebauten NT*, entsprechen denen im Verfahren zur 
Sequenzierung langer NSKs. Die wesentlichen Unterschiede 
zwischen beiden Verfahren liegen in der Materialauswahl und - 
Vorbereitung und in der Verarbeitung der gewonnenen Daten. 

Auswahl des Materials : 
Genprodukte konnen von verschiedenen biologischen Objekten 
stammen, so z.B. von einzelnen Zellen, Zellpopulationen, 
einem Gewebe oder von kompletten Organismen. Auch biologische 
Fliissigkeiten wie Blut, Sputum oder Liquor konnen als Quelle 
der Genprodukte dienen. Die Methoden zur Gewinnung der 
Genprodukte aus den verschiedenen biologischen Objekten sind 
bespielsweise folgenden Literaturquellen zu entnehmen: 
"Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor 
Laboratory , "Method in Enzymology" 1999, v303, " cDNA library 
protocols" 1997, Ed. I.G. Cowell, Humana Press Inc.. 

Es kann sowohl die Gesamtheit der isolierten Genprodukte als 
auch ein durch eine Vorselektion ausgewahlter Teil davon in 
die Sequenzierungsreaktion eingesetzt werden. Durch 
Vorselektion kann man die Menge der zu analysierenden 



WO 03/020968 



61 



PCT7EP02/09614 



Genprodukte reduzieren'. Die Vorselektion kann beispielsweise 
durch molekularbiologische Verfahren wie z.B. PCR- 
Amplifikation, Gel-Auf trennung oder Hybridisierung mit 
anderen Nukleinsaureketten erfolgen ("Molecular cloning" 
1989, Ed. Maniatis, Cold Spring Harbor Laboratory , "Method 
in Enzymology" 1999, v3 03, " cDNA library protocols" 1997 , Ed. 
I . G . Cowell , Humana Press Inc . ) 

Vorzugsweise wird die Gesamtheit der Genprodukte als 
Ausgangsmaterial gewahlt . 

Vorbereituncr des Materials : 

Ziel der Vorbereitung des Materials ist es, aus dem Ausgangs- 
material an die Oberflache gebundene, extensions!: ahige 
Genprodukt-Primer-Komplexe zu bilden. Wobei pro Genprodukt 
maximal nur ein Primer binden sollte. 

Primerbindungsstelle (PBS) : 
Jedes Genprodukt hat vorzugsweise nur eine 

Primerbindungsstelle . 

Eine Primerbindungsstelle ist ein Sequenzabschnitt , der eine 
selektive Bindung des Primers an das Genprodukt ermoglichen 
soil. 

Als Primerbindungsstellen konnen Abschnitte in der 
Nukleinsauresequenz dienen, die in den zu analysierenden 
Sequenzen natiirlicherweise vorkommen (z.B. polyA-Strecken in 
niRNA) . Eine Primerbindungsstelle kann auch zusatzlich in das 
Genprodukt eingefiihrt werden (Molecular cloning" 1989, Ed. 
Maniatis, Cold Spring Harbor Laboratory , "Method in 
Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. 
I.G. Cowell, Humana Press Inc.). 

Aus Grunden der Vereinf achung der . Analyse kann es wichtig 
sein, dass eine moglichst einheitliche Primerbindungsstelle in 
alien Genprodukten vorhanden ist. Dann konnen Primer mit 
einheitlicher Struktur in die Reaktion eingesetzt werden. 
Die Zusammensetzung der Primerbindungsstelle ist nicht einge- 
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schrankt . Ihre Lange betragt vorzugsweise zwischen 10 und 100 
NTs . Die Primerbindungsstelle kann eine funktionelle Gruppe 
tragen, beispielsweise zur Bindung des Genprodukts an die 
Oberflache. Diese funktionelle Gruppe kann z.B. eine Biotin- 
oder Digoxigenin- Gruppe sein. 

Als Beispiel fur die Einfiihrung einer Primerbindungsstelle in 
die Genprodukte wird das Nukleotid-Tailing von antisense cDNA- 
Fragmenten beschrieben. 

Als erstes werden einzelstrangige cDNAs von mRNAs 
synthetisiert . Es resultiert eine Population an cDNA- 
Molekiilen, die eine Kopie der mRNA- Population darstellen, 
sogenannte antisense- cDNA. (Molecular cloning" 1989, Ed. 
Maniatis, Cold Spring Harbor Laboratory , "Method in 
Enzymology" 1999, v303, " cDNA library protocols" 1997, Ed. 
I.G. Cowell, Humana Press Inc.). Mit- einer terminalen 
Deoxynucleotidyltransf erase kann man mehrere (z.B. zwischen 10 
und 20) Nukleosid-monophosphate an das 3'-Ende dieser 
antisense cDNA anknupfen, z.B. mehrere Adenosin-Monophosphate 
((dA)n-Tail genannt) . Das entstehende Fragment wird zur 
Bindung des Primers, in diesem Beispiel eines (dT) n- Primers, 
verwendet ( "Molecular cloning" 1989 J.Sambrook et al. Cold 
Spring Harbor Laborotary Press, "Method in Enzymology" 1999 
v.303, S. 37-38) . 

Primer fur die Sequenzieruncrsreaktion: 
Dieser hat die Funktion, den Start an einer einzigen Stelle 
des Genprodukts zu ermoglichen. Vorzugsweise bindet er an die 
Primerbindungsstelle im Genprodukt. Die Zusammensetzung und 
die Lange des Primers sind nicht eingeschrankt . AuSer der 
Startfunktion kann der Primer auch andere Funktionen 
ubernehmen, wie z.B. eine Verbindung der Genprodukt -Primer - 
Komlexe zur Reaktionsoberf lache zu schaffen. Primer sollten so 
an die Lange und Zusammensetzung der Primerbindungsstelle 
angepafit werden, dass der Primer den Start der Sequenzie- 
rungsreaktion mit der jeweiligen Polymerase ermoglicht. 
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Vorzugsweise betragt die Lange des Primers zwischen 6 und 100 
NTs, optimalerweise zwischen 15 und 30 NTs. Der Primer kann 
eine funktionelle Gruppe tragen, die beispielsweise zur 
Bindung des Primers an die Oberflache dient, beispielsweise 
ist eine solche funktionelle Gruppe eine Biotingruppe (s. 
Abschnitt Immobilisierung) . Sie soli die Sequenzierung nicht 
storen. Die Synthese eines solchen Primers kann z.B. mit dem 
DNA- Synthesizer 3 80 A Applied Biosystems ausgefuhrt werden 
oder aber als Auft rags synthese bei einem kommerziellen 
Anbieter, z.B. MWG-Biotech GmbH, Deutschland, erstellt werden. 

Es konnen auch unterschiedliche Primer verwendet werden, ein 
definierter Primersatz, oder ein Primergemisch. 

Der Primer kann vor der Hybridisierung an die zu 
anaiysierenden Fragmente auf der Oberflache mit verschiedenen 
Techniken fixiert oder direkt auf der Oberflache synthetisiert 
werden beispielsweise nach (McGall et al . US Patent 5412087, 
Barrett et al . US Patent 5482867, Mirzabekov et.al. US Patent 
5981734, "Microarray biochip technology" 2000 M.Schena Eaton 
Publishing, " DNA Microarrays" 1999 M. Schena Oxford University 
Press, Fodor et al. Science 1991 v. 285 S.767, Timofeev et al. 
Nucleic Acid Research (NAR) 1996, v. 24 S.3142, Ghosh et al. 
NAR 1987 v.15 S.5353, Gingeras et al . NAR 1987 v. 15 S.5373, 
Maskos et al. NAR 1992 v. 20 S.1679) . 

Die Primer werden auf der Oberflache in einer Dichte zwischen 
10 bis 100 pro 100 urn 2 , 100 bis 10.000 pro 100 fim 2 , 10.000 bis 
1.000.000 pro lOOptm 2 oder grofier als 1.000.000 pro 100 /xm 2 
gebunden. 

Der Primer oder das Primergemisch wird mit Genprodukten unter 
Hybridisierungsbedingungen inkubiert, die ihn selektiv an die 
Primerbindungsstelle jedes Genprodukts binden lassen. Diese 
Primer-Hybridisierung (Annealing) kann vor (1) , wahrend (2) 
oder nach (3) der Bindung der Genprodukte an die Oberflache 
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erfolgen. Falls Genprodiikte als doppelstrangige Nukleinsauren 
vorliegen, werden sie vor der Hybridisierung durch Hitze 
denaturiert ("Molecular cloning" 1989 J.Sambrook et al. Cold 
Spring Harbor Laborotary Press) . Die Optimierung der 
Hybridisierungsbedingungen hangt von der genauen Struktur der 
Primerbindungsstelle und des Primers ab und laSt sich nach 
Rychlik et al. (NAR 1990 v. 18 S.6409) berechnen. Im folgenden 
werden diese Hybridisierungsbedingungen als standardisierte 
Hybridisierungsbedingungen bezeichnet . 

Falls das Ausgangsmaterial eine poly-A-Strecke oder eine poly- 
dA-Strecke aufweist (z.B. mRNA, sense cDNA oder ant i sense - cDNA 
mit (dA) n -Tail) kann man einen oligo-dT-Primer verwenden. Es 
kann allerdings auch ein Primergemisch bestehend aus 12 
verschiedenen Primern mit folgender allgemeiner Struktur 
5 , (K) n MN3 I verwendet werden. Wobei (n) zwischen 10 und 50 
liegt, vorzugsweise zwischen 20 und 30. "K" steht fur dT oder 
dU, "M" und "N" stehen jeweils fur dA, dT oder dU, dC, dG 
(z .B.5" -dTdTdTdTdTdTdTdTdTdT 10 dTdTdTdTdTdTdTdTdTdT 2O dAdG-3 " ) . 
Ein solches Primergemisch ermoglicht einen exakten Start der 
Sequenzierungsreaktion am Ende der polyA-Strecke oder der 
poly-dA-Strecke (geankerter Primer) . 

Fixierung von Genprodukt- Primer -Komplexen an die Oberflache 
(Bindung bzw. Immobilisierung von Genprodukten) : 

Ziel der Fixierung (Bindung, Immobilisierung) ist es, 
Genprodukt-Primer-Komplexe auf einer geeigneten planen 
Oberflache in einer Art und Weise zu fixieren, dass eine 
zyklische enzymatische Sequenzierungsreaktion ablaufen kann. 
Dies kann beispielsweise durch Bindung des Primers (s.o.) oder 
des Genprodukts an die Oberflache erfolgen. 

Die Reihenfolge der Schritte bei der Bindung von Genprodukt - 
Primer-Komplexen kann variabel sein: 

4) Die Genprodukt- Primer- Komplexe konnen zunachst in einer 
Losung durch Hybridisierung (Annealing) gebildet und 
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anschlieSend an die Oberflache gebunden werden. 
5) Primer konnen zunachst auf einer Oberflache gebunden 
werden und Genprodukte anschlieSend an die gebundenen 
Primer hybridisiert werden, wobei Genprodukt-Primer- 
Komplexe entstehen (Genprodukte indirekt an die 
Oberflache gebunden) 
G) Die Genprodukte konnen zunachst an die Oberflache 
gebunden werden (Gendprodukte direkt an die Oberflache 
gebunden) und im anschlieSenden Schritt die Primer an 
die gebundenen Genprodukte hybridisiert werden, wobei 
Genprodukt- Primer- Komplexe entstehen. 
Die Immobilisierung der Genprodukte an die Oberflache kann 
daher durch direkte oder indirekte Bindung erfolgen. 

Oberflache und Reaktionsoberf lache sind in dieser Anmeldung 
als gleichwertige Begriffe aufzufassen, auSer wenn explizit 
auf eine andere Bedeutung hingewiesen wird. Als Reaktionsober- 
flache dient die Oberflache einer festen Phase eines 
beliebigen Materials. Dieses Material ist vorzugsweise 
enzymatischen Reaktionen gegemiber inert und verursacht keine 
Storungen der Detektion. Silicon, Glas, Keramik, Kunststoff 
(z.B. Polycarbonate oder Polystyrole) , Metall (Gold, Silber, 
oder Aluminium) oder beliebiges anderes Material, das diesen 
funktionalen Anf orderungen genugt, kann verwendet werden. 
Vorzugsweise ist die Oberflache nicht verformbar, denn sonst 
ist mit einer Verzerrung der Signale bei der wiederholten 
Detektion zu rechnen. 

Falls eine gelartige feste Phase (Oberflache eines Gels) 
verwendet wird, so kann dieses Gel z.B. ein Agarose- oder 
Polyacrylamidgel sein. Das Gel ist vorzugsweise fur Molekiile 
mit einer Molekularmasse unter 5000 Da frei passierbar 
(beispielsweise kann ein 1 bis 2% Agarose-Gel oder 5 bis 15% 
Polyacrylamid Gel verwendet werden) . Eine solche Geloberf lache 
hat anderen festen Oberflachen gegeniiber den Vorteil, dass es 
zu einer wesentlich geringeren unspezif ischen Bindung von NT*s 
an die Oberflache kommt . Durch die Bindung der Genprodukt- 
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Primer-Komplexe auf der Oberflache ist die Detektion der 
Fluoreszenzsignale von eingebauten NTs* moglich. Die Signale 
von freien NTs* werden nicht detektiert, weil sie nicht an das 
Material des Gels binden und somit nicht immobilisiert werden. 
Das Gel ist vorzugsweise auf einer festen Unterlage befestigt. 
Diese feste Unterlage kann Silicon, Glas, Keramik, Kunststoff 
(z.B. Polycarbonate oder Polystyrole) , Metall (Gold, Silber, 
oder Aluminium) oder beliebiges anderes Material sein. 
Die Dicke des Gels betragt vorzugsweise nicht mehr als 0,1 
mm. Die Geldicke ist jedoch vorzugsweise grofier als die 
einfache Tief enscharf e des Objektivs, damit unspezifisch an 
die feste Unterlage gebundene NTs* nicht in die Fokusebene 
gelangen und damit detektiert werden. Wenn die Tief enscharf e 
z.B. 0,3 pm betragt, so liegt die Geldicke vorzugsweise 
zwischen 1 pm und 100 pm. Die Oberflache kann als eine 
kontinuierliche Oberflache oder als diskontinuierliche, aus 
einzelnen kleinen Bestandteilen (z.B. Agarose-Kugelchen) 
zusammengesetzte Oberflache hergestellt werden. Die 
Reaktionsoberf lache muB groS genug sein, urn die notwendige 
Anzahl der Genprodukte bei entsprechender Dichte binden zu 
konnen. Die Reaktionsoberf lache sollte vorzugsweise nicht 
grower als 20 cm 2 sein. 

Die verschiedenen Zyklusschritte erfordern einen Austausch der 
unterschiedlichen Reaktionslosungen liber der Oberflache. Die 
Reaktionsoberf lache ist vorzugsweise Bestandteil eines Reak- 
tionsgef a£es . Das Reaktionsgef aS ist wiederum vorzugsweise 
Bestandteil einer Reaktionsapparatur mit Durchf lufivorrichtung . 
Die Durchf luSvorrichtung ermoglicht einen Austausch der 
Losungen im Reaktionsgef aS. Der Austausch kann mit einer durch 
einen Computer gesteuerten Pumpvorrichtung oder manuell 
erfolgen. Wichtig dabei ist, dass die Oberflache nicht 
austrocknet. Vorzugsweise betragt das Volumen des 
Reaktionsgef a£es weniger als 50 \xl . Idealerweise betrSgt sein 
Volumen weniger als 1 pi. 

Falls die Fixierung der Genprodukt-Primer-Komplexe auf der 
Oberflache liber die Genprodukte erfolgt, kann dies 
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beispielsweise durch die Bindung der Genprodukte an einera der 
beiden Ketten-Enden erfolgen. Dies kann durch entsprechende 
kovalente, affine oder andere Bindungen erreicht werden. Es 
sind viele Beispiele der Immobilisierung von Nukleinsauren 
bekannt (McGall et al . US Patent 5412087, Nikiforov et al. US 
Patent 5610287, Barrett et al. US Patent 5482867, Mirzabekov 
et al. US Patent 5981734, "Microarray biochip technology" 2000 
M.Schena Eaton Publishing, " DNA Microarrays" 1999 M. Schena 
Oxford University Press, Rasmussen et al . Analytical 
Biochemistry v. 198, S.138, Allemand et al. Biophysical Journal 
1997, v.73, S.2064, Trabesinger et al. Analytical Chemistry 
1999, v.71, S.279, Osborne et al. Analytical Chemistry 2000, 
v.72, S.3678, Timofeev et al. Nucleic Acid Research (NAR) 
1996, v.24 S.3142, Ghosh et al . NAR 1987 v. 15 S.5353, Gingeras 
et al. NAR 1987 v. 15 S.5373, Maskos et al . NAR 1992 v. 20 
S.1679) . Die Fixierung kann auch durch eine unspezif ische 
Bindung, wie z.B. durch Austrocknung der Genprodukte 
enthaltenden Probe auf der planen Oberflache erreicht werden. 
Die Genprodukte werden auf der Oberflache in einer Dichte 
zwischen 10 und 100 pro 100 jam 2 , 100 bis 10.000 pro 100 /xm 2 , 
10.000 bis 1000.000 pro 100/im 2 gebunden. 

Die fur die Detektion notwendige Dichte von extensionsf ahigen 
Genprodukt-Primer-Komplexen betragt ca. 10 bis 100 pro 100 
/im 2 . Sie kann vor, wahrend oder nach der Hybridisierung der 
Primer an die Genprodukte erreicht werden. 

Beispielhaft werden im folgenden einige Methoden zur Bindung 
naher dargestellt: 

In einer Ausfuhrungsf orm erfolgt die Bindung der Genprodukt- 
Primer-Komplexe uber Biotin-Avidin oder Biotin- St reptavidin- 
Bindung. Dabei wird Avidin oder Streptavidin auf der 
Oberflache kovalent gebunden, das 5'-Ende des Primers ist mit 
Biotin modifiziert. Nach der Hybridisierung der modif izierten 
Primer mit den Genprodukten (in Losung) werden diese auf der 
mit Avidin/Streptavidin beschichteten Oberflache fixiert. Die 
Konzentration der mit Biotin markierten Genprodukt- Primer- 
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Komplexe sowie die Zeit der Inkubation dieser Losung mit der 
Oberflache wird so gewahlt, dass eine fur die Sequenzierung 
geeignete Dichte erreicht wird. 

In einer anderen Ausfuhrungsform werden die fur die 
Sequenzierungsreaktion geeigneten Primer vor der 
Sequenzierungsreaktion auf der Oberflache mit geeigneten 
Methoden fixiert (s.o.). Die einzelstrangigen Genprodukte mit 
jeweils einer Primerbindungsstelle pro Genproduktmolekul 
werden damit unter Hybridisierungsbedingungen inkubiert 
(Annealing) . Dabei binden sie an die fixierten Primer und 
werden dadurch an die Oberflache gebunden (indirekte Bindung) . 
Die Konzentration der einzelstrangigen Genprodukte und die 
Hybridisierungsparameter (z.B. Temperatur, Zeit, Puffer) 
werden so gewahlt, dass man eine fur die Sequenzierung ge- 
eignete Dichte von ca. 10 bis 100 extensionsf ahigen 
Genprodukt-Primer-Komplexen pro 100 jam 2 erreicht. Nach der 
Hybridisierung werden ungebundene Genprodukte durch einen 
Waschschritt entfernt. Bei dieser Ausfuhrungsform wird eine 
Oberflache mit einer hohen Primerdichte bevorzugt, z.B. ca. 
1.000.000 Primer pro lOOjxm 2 oder noch hoher, da die gewunschte 
Dichte an Genprodukt-Primer-Komplexen schneller erreicht wird, 
wobei die Genprodukte nur an einen Teil der Primer binden. 

In einer anderen Ausfuhrungsform werden die Genprodukte an die 
Oberflache direkt gebunden (s.o.) und anschlieSend mit Primern 
unter Hybridisierungsbedingungen inkubiert. Bei einer Dichte 
von ca. 10 bis 100 Genprodukte pro lOO^m 2 wird man versuchen 
alle verfugbaren Genprodukte mit einem Primer zu versehen und 
fur die Sequenzierugnsreaktion verfugbar zu machen. Dies kann 
durch hohe Primerkonzentration beispielsweise 1 bis 100 mmol/1 
erreicht werden. Bei einer hoheren Dichte der fixierten 
Genprodukte auf der Oberflache, beispielsweise 10.000 bis 
1.000.000 pro 100/xm 2 , kann die fur die optische Detektion 
notwendige Dichte der Genprodukt- Primer- Komplexe wahrend der 
Primer-Hybridisierung erreicht werden. Dabei sind die 
Hybridisierungsbedingungen (z.B. Temperatur, Zeit, Puffer, 
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Primerkonzentratin) so ' zu wahlen, dass die Primer nur an 
einen Teil der immobilisierten Genprodukte binden. 

Falls die Oberflache einer festen Phase (z.B. Silikon oder 
Glas) zur Immobilisation verwendet wird, wird vorzugsweise 
eine Blockierungslosung auf die Oberflache vor dem Schritt (a) 
in jedem Zyklus gebracht, die zur Vermeidung einer unspezifi- 
schen Adsorbtion von NTs* an der Oberflache dient. Diese 
Bedingungen fur eine Blockierlosung erfullt beispielsweise 
eine Albuminldsung (BSA) mit einem pH-Wert zwischen 8 und 10. 

Wahl der Polymerase: 

Bei der Wahl der Polymerase spielt die Art der verwendeten 
immobilisierten Nukleinsaure (RNA oder DNA) eine 
entscheidende Rolle: 

Falls RNA als Genprodukt (z.B. mRNA) in die 
Sequenzierungsreaktion eingesetzt wird, konnen handelsubliche 
RNA-abhangige DNA-Polymerasen eingesetzt werden, z.B. AMV- 
Reverse Transcriptase (Sigma) , M-MLV Reverse Transcriptase 
(Sigma), HIV-Reverse Transcriptase ohne RNAse-Aktivitat . Alle 
Reverse Transcriptasen miissen von RNAse-Aktivitat weitgehend 
frei sein ("Molecular cloning" 1989, Ed. Maniatis, Cold 
Spring Harbor Laboratory) . 

Falls DNA als Genprodukt (z.B. cDNA) verwendet wird, eignen 
sich als Polymerasen prinzipiell alle DNA-abhangigen DNA- 
Polymerasen ohne 3 v -5" Exonuklease-Aktivitat (DNA- 
Replication" 1992 Ed. A.Kornberg, Freeman and company NY), 
z.B. modifizierte T7-Polymerase vom Typ "Sequenase Version 2" 
(Amersham Pharmacia Biotech) , Klenow Fragment der DNA-Poly- 
merase I ohne 3'-5 ! Exonukleaseaktivitat (Amersham Pharmacia 
Biotech) , Polymerase Beta verschiedenen Ursprungs (Animal 
Cell DNA Polymerases" 1983, Fry M . , CRC Press Inc., 
kommerziell erhaltlich bei Chimerx) thermostabile Polymerasen 
wie Taq- Polymerase (GibcoBRL) , proHA-DNA- Polymerase 
(Eurogentec) . 



WO 03/020968 
• 



70 



PCT/EP02/09614 



Detektion: 

Wie bei der Sequenzierung langer NSKs, umfasst die Detektion 
folgende Phasen: 

1) Vorbereitung zur Detektion 

Durchfuhrung eines Detektionsschrittes in jedem Zyklus, wobei 
jeder Detektionsschritt als Scanvorgang ablauft und folgende 
Operationen umfaJSt: 

a) Einstellung der Position des Objektivs (X,Y-Achse) , 

b) Einstellung der Fokusebene (Z-Achse) , 

c) Detektion der Signale einzelner Molekule, Zuordnung des 
Signals zu NT* und Zuordnung des Signals zum jeweiligen 
Genprodukt , 

d) Verschiebung zur nachsten Position auf der Oberflache. 

Die Signale von in die den Genprodukten komplementaren 
Strange eingebauten NTs* werden durch das Abscannen der 
Oberflache registriert. Der Scanvorgang wird wie bei der 
Sequenzieurng langer NSKs durchgef uhrt . Dabei wird das 
Objektiv schrittweise iiber die Oberflache bewegt, so daS von 
jeder Oberf lachenposition ein zweidimensionales Bild (2D- 
Bild) entsteht. 

Vorbereitung zur Detektion: 

Am Anfang wird festgelegt, wie viele Kopien der Genprodukte 
zur Expressionsanalyse notwendig sind. Mehrere Faktoren 
spielen dabei eine Rolle. Die genaue Zahl hangt z.B. von der 
relativen Prasenz der Genprodukte im Ansatz und von der 
gewunschten Genauigkeit der Analyse ab. Die Anzahl der 
analysierten Genprodukte liegt vorzugsweise zwischen 1000 und 
10.000.000. Fur stark exprimierte Gene kann die Anzahl der 
analysierten Genprodukte niedrig sein, z.B. 1000 bis 10.000. 
Bei der Analyse schwach exprimierter Gene mu£ sie erhoht 
werden, z.B. auf 100.000 oder noch we iter. 

Es werden bespielsweise 100.000 einzelne Genprodukte 
gleichzeitig analysiert. Dabei werden auch schwach 
exprimierte Gene (mit z.B. ca.100 mRNA-Molekulen/Zelle, was 
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ca. 0.02% gesamt-mRNA entspricht) in der Reaktion mit 
durchschnittlich 20 identif izierten Genprodukten 

reprasentiert . 

2) Durchfuhrung eines Detektionsschrittes in jedem Zyklus 
gleicht der in der Sequenzierung langer NSKs . Anstelle von 
NSKFs werden Genprodukte verwendet. 

Analyse : 

Die gewonnenen Daten (kurze Sequenzen) werden mit Hilfe eines 
Programms mit bekannten Gensequenzen verglichen. Einem 
solchen Programm kann z.B. ein BLAST oder FASTA Algorithmus 
zugrunde liegen ("Introduction to computational Biology" 1995 
M.S. Waterman Chapman & Hall) . 

Durch die Wahl der Methode zur Materialvorbereitung wird 
unter anderem festgelegt, in welchen Abschnitten der 
Genprodukte die Sequenzen ermittelt werden und zu welchem 
Strang (sense oder antisense) sie gehdren. Z.B. werden bei 
der Verwendung der polyA-Strecken als Primerbindungsstelle in 
mRNA Sequenzen aus NTRs (non-translating-regions) bestimmt. 
Bei der Verwendung der Methode mit antisense-cDNA als Matrize 
stammen die ermittelten Sequenzen unter anderem aus den 
proteinkodierenden Bereichen der Genprodukte. 

Bei einer bevorzugten einfachen Variante der Erfindung wird 
die Genexpression nur qualitativ bestimmt. Dabei ist nur die 
Tatsache der Expression bestimmter Gene von Bedeutung. 

Bei einer anderen bevorzugten Aus fuhrungs form ist eine 
quantitative Bestimmung der Verhaltnisse zwischen einzelnen 
Genprodukten im Ansatz von Interesse. Es ist bekannt, dafi die 
Aktivitat eines Gens in einer Zelle durch eine Population 
identischer mRNA-Molekule reprasentiert ist. In einer Zelle 
sind viele Gene gleichzeitig aktiv und werden dabei 
unterschiedlich stark exprimiert, was zum Vorhandensein 
vieler verschiedener unterschiedlich stark reprasentierter 
mRNA-Populationen fuhrt. 
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Im folgenden wird auf die quantitative Analyse der 
Genexpression naher eingegangen: 

Fur eine quantitative Analyse der Genexpression werden die 
Abundanzen * einzelner Genprodukte in der 

Sequenzierungsreaktion bestimmt. Dabei sind die Produkte 
stark exprimierter Gene in der Sequenzierungsreaktion 
haufiger vertreten als die schwach exprimierter Gene. 
Nach der Zuordnung der Sequenzen zu bestimmten Genen wird der 
Anteil der ermittelten Sequenzen fur jedes einzelne Gen 
bestimmt-. Gene mit starker Expression haben einen hoheren 
Anteil an der Gesamtpopulation der Genprodukte als Gene mit 
schwacher Expression . 

Die Anzahl der analysierten Genprodukte liegt vorzugsweise 
zwischen 1000 und 10.000.000. Die genaue Anzahl der zu 
analysierenden Genprodukte hangt von der Aufgabenstellung ab. 
Fur stark exprimierte Gene kann sie niedrig sein, z.B. 1000 
bis 10.000. Bei der Analyse schwach exprimierter Gene muS sie 
erhoht werden, z.B. auf 10 0.000 oder hoher. 

Werden bespielsweise 100.000 einzelne Genprodukte 
gleichzeitig analysiert, sind auch schwach exprimierte Gene, 
wie z.B. ca.100 mRNA-Molekule/Zelle (was ca. 0.02% gesamt- 
mRNA entspricht) , in der Reaktion mit durchschnittlich 20 
identif izierten Genprodukten reprasentiert . 

Als interne Kontrolle der Hybridisierung, der Immobilisation 
und der Sequenzierungsreaktion lafit sich folgende Methode 
verwenden : 

Es konnen eine oder mehrere Nukleinsaureketten mit bekannten 
Sequenzen als Kontrolle eingesetzt werden. Die 
Zusammensetzung dieser Kontrollsequenzen ist nicht 
eingeschrankt, sofern sie die Identif izierung der Genprodukte 
nicht storten. Bei der Sequenzanalyse der mRNA-Proben werden 
RNA-Kontrollproben, bei der Analyse der cDNA-Proben 
entsprechend DNA-Kontrollproben eingesetzt. Diese Proben 
werden vorzugsweise bei alien Schritten mitgefflhrt. Sie 
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konnen z.B. nach der' mRNA- Isolation zugegeben werden. Im 
allgemeinen werden die Kontrollproben in gleicher Weise zur 
Sequenzanalyse vorbereitet wie die zu analysierenden 
Genprodukte . 

Die Kontrollsequenzen werden in bekannten, fest eingestellten 
Konzentrationen zu den zu analysierenden Genprodukten 
zugegeben. Konzentrationen der Kontrollproben konnen 
unterschiedlich sein, vorzugsweise liegen diese 
Konzentrationen zwischen 0.01% und 10% der 

Gesamtkonzentration der zu analysierenden Probe (100%) . 
Betragt die Konzentration der mRNA beispielsweise 10ng/nl, 
dann liegen die Konzentrationen von Kontrollproben zwischen 
lpg/lJ.1 und lng/jil . 

Bei der quantitativen Analyse der Genexpression muS auch die 
allgemeine metabolische Aktivitat der Zellen beriicksichtigt 
werden, insbesondere , wenn ein Vergleich der Expression 
bestimmter Gene bei verschiedenen auEeren Bedingungen 
angestrebt wird. 

Die Veranderung im Expressionsniveau eines bestimmten Gens 
kann als Folge der Veranderung in der Transkriptionsrate 
dieses Gens oder als Folge einer globalen Veranderung der 
Genexpression in der Zelle auftreten. Zur Beobachtung der 
metabolischen Zustande in der Zelle kann man die Expression 
der sogenannten "House-keeping-Gene" analysieren. Beim Mangel 
an wichtigen Metaboliten ist beispielsweise das allgemeine 
Expressionsniveau in der Zelle niedrig, so daS auch 
konstitutiv exprimierte Gene eine niedriges Expressionsniveau 
haben. 

Im Prinzip konnen alle konstitutiv exprimierten Gene als 
"House-keeping-Gene" dienen. Als Beispiele seien das 
Transferrin-Rezeptor-Gen oder das Beta-Aktin-Gen genannt . 
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Die Expression dieser House -keeping-Gene dient somit als 

BezugsgroSe fur die Analyse der Expression anderer Gene. Die 

Sequenzermittlung und Quantif izierung der Expression der 

House-keeping-Gene ist vorzugsweise ein Bestandteil des 
5 Analyse -Programms fur die Genexpression. 

Wie bei der Sequenzierung langer NSKs kann man 
Sequenzierungsreaktion mit 4 markierten oder 2 markierten und 
2 unmarkierten NT* durchfuhren. 

0 

Sequenzanalvse mit 4 markierten NTs*Seauenzanalvse mit • 4 
markierten NTs* 



Bei einer bevorzugten Ausf uhrungsf orm der Erfindung werden 
15 alle vier in die Reaktion eingesetzten NTs* mit Fluoreszenz- 
farbstoffen markiert . 

Dabei verwendet man eine der oben genannten farbigen 
Kodierungs schemata. Die Zahl der ermittelten NTs fur jede 
Sequenz aus einem Genprodukt liegt zwischen 5 und 100, 

20 idealerweise zwischen 20 und 50. Diese ermittelten Sequenzen 
werden mit Hilfe eines Programms mit bekannten Sequenzen in 
Gen-Datenbanken verglichen und entsprechenden Genen 
zugeordnet. Einem solchen Programm kann z.B. der BLAST oder 
FASTA Algorithmus zugrunde liegen ("Introduction to 

25 computational Biology" 1995 M.S. Waterman Chapman Sc Hall) . 



Ein Zyklus hat f olgende Schritte : 

a) Zugabe einer Losung mit markierten Nukleotiden (NTs*) 
und Polymerase zu immobilisierten 

30 Nukleinsaureketten, 

b) Inkubation der immobilisierten Nukleinsaureketten mit 
dieser Losung unter Bedingungen, die zur 
Verlange rung der komplementaren Strange um ein NT 
geeignet sind, 

35 c) Waschen 

d) Detektion der Signale von einzelnen Molekulen 

e) Entfernung der Markierung von den eingebauten 
Nukleotiden und des zur Termination fiihrenden 
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Substituenten, ' 
f) Waschen. 



Seguenzanalvse mib 2 markierten NTs* und 2 unmarkierten NTs 
(2NTs* / 2NTs-Methode) . 

In einer anderen Ausfuhrungsform werden fur die Analyse der 
Sequenzen 2 modifizierte NTs* und 2 unmodif izierte NTs einge- 
setzt . 

Diese Ausfuhrungsform beruht auf dem Prinzip, daS eine 
Abfolge aus 2 Signalen (markierte NT*s) geniigend 
Informationen zur Identif izierung einer Sequenz enthalten 
kann. Die ermittelte Sequenz wird mit der Ref erenzsequenz 
verglichen und einer bestimmten Position zugeordnet, z.B.: 

ACCAAAACACCC - ermittelte Sequenz (dCTP* und dATP* sind 
markiert) 

ATCATCGTTCGAAATATCGATCGCCTGATGCC - Ref erenzsequenz 

A-C C-AAA-A-C-A-C-CC (zugeordnete ermittelte Sequenz) 

ATCATCGTTCGAAATATCGATCGCCTGATGCC (Ref erenzsequenz ) 

Vorzugsweise wird die ermittelten Sequenzen mit Hilfe eines 
Programms der Ref erenzsequenz zugeordnet. Einem solchen 
Programm kann z.B. der BLAST Oder FASTA Algorithmus zugrunde 
liegen ("Introduction to computational Biology" 1395 M.S. 
Waterman Chapman & Hall) . 

Die Genprodukte werden wie oben beschrieben zur Sequenzierung 
vorbereitet und mit 2NTs*/2NTs-Methode sequenziert. Man 
erhalt Sequenzenabschnitte aus Genprodukten, wobei jede 
Sequenz eine Abfolge aus 2NTs* darstellt. Bekannte 
Gensequenzen dienen als Ref erenzsequenzen. Urn eine eindeutige 
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Zuordnung der ermittelten Sequenz zu einer bekannten 
Ref erenzsequenz zu ermoglichen, muS diese Abfolge lang genug 
sein. Vorzugsweise betragt die Lange der ermittelten 
Sequenzen mehr als 20 NT's. Da 2 markierte NTs* nur einen Teil 
der Sequenz darstellen, ist die Gesamtlange des 
synthetisierten komplementaren Strangs ca. doppelt so lang, 
wie die Abfolge der detektierten NTs* (bei 2 0 detektierten 
NTs" betragt die Gesamtlange z.B. durchschnittlich 40 NTs). 

Zur Synthese eines komplementaren Stranges werden 4 
Nukleotide benotigt. Da die mit einem Fluoreszenzfarbstof f 
markierten NTs* in der vorliegenden Erfindung als 
Semiterminatoren auftreten, d.h. die Termination 
ausschliefilich bei Verfugbarkeit modif izierter NTs* auftritt, 
miissen unmodif izierte NTs in einem zusatzlichen Schritt in 
jedem Zyklus in die Reaktion zugegeben werden. Die genaue 
Position dieses Schrittes in dem Zyklus kann variieren. 
Wichtig dabei ist, daS die markierten NTs* und die 
unmodif izierte NTs getrennt verwendet werden. 

Ein Zyklus bei dieser Ausfiihrungsf orm kann beispielhaft 
folgendermaSen aussehen: 

a) Zugabe einer Losung mit modif izierten NTs* und 
Polymerasen auf die Oberflache mit den 
bereitgestellten Genprodukten 

b) Inkubation der immobilisierten Nukleinsaureketten mit 
dieser Losung unter Bedingungen, die zur 
Verlangerung der komplementaren Strange urn ein NT 
geeignet sind, 

c) Waschen 

d) Detektion der Signale von einzelnen, modif izierten und 
in die den Genprodukten komplementaren 
neusynthetisierten Strangen eingebauten NTs*-Molekulen 

e) Entfernung der Markierung und der terminierenden 
Gruppe bei den eingebauten Nukleotiden 

f) Waschen 
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g) Zugabe von 2 unmodif izierten NTs und Polymerase!! 

h) Waschen. 

Die Konzentration der NTs liegt vorzugsweise unter 1 mM, 
idealerweise unter 10 pM. 



Beispiel 4 : 

Eine besondere Ausf iihrungsf orm des Verfahrens stellt die 
Analyse von Einzelnukleotidpolymorphismen mit 

sequenzspezif ischen Primern dar. 

Zusatzlich zu Abschnitt 1 "Abkurzungen und 

Begriff serlauterungen" werden fur dieses Beispiel folgende 
Begrif f e def iniert : 

Primer - Zur Verdeutlichung des erf inderischen Gedankens 
werden in diesem Beispiel folgende Begrif fe unterschieden : 

a) Unter einem gPrimer^ wird vorliegend allgemein eine 
Population von Primermolekulen mit einheitlicher 
Struktur verstanden. 

b) gmehrere Primer ~ o.a. werden im Text als mehrere 
Populationen von Primermolekulen verstanden, die 
unterschiedliche Struktur besitzen. 

c) Ein §Primer-Molekulg bedeutet ein einziges 
Oligonukleotid-Molekul . 

d) ^Mehrere Primer -Molekuleg bedeuten mehrere einzelne 
Oligonukleotid-Molekule; sie konnen einheitliche oder 
unterschiedliche Struktur aufweisen. 

SNP-Stelle - eine Position in NSK, die auf Vorhandensein oder 
Abwesenheit von SNP untersucht wird. 

Zielsequenz - Teil einer Gesamtsequenz, der durch die 
Verwendung eines spezifischen Primers in der 

Sequenzierungsreaktion sequenziert/ bestimmt wird. Eine 
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Gesamtsequenz kann mehrere Zielsequenzen enthalten. Eine 
Zielsequenz ist gemigend lang, urn eine Positionierung dieser 
Zielsequenz innerhalb der Gesamtsequenz rait groSer 
Wahrscheinlichkeit zu gewahrleisten. Zielsequenzen konnen 
beispielsweise eine oder mehrere SNP-Stellen enthalten. 

Erkennungssequenz - Teil der Zielsequenz, der fur die 
Zuordnung dieser Zielsequenz in der Gesamtsequenz verwendet 
wird. 

In dieser Ausf iihrungsf orm zur 'SNP -Analyse werden mehrere 
potent ielle SNP-Positionen in der Ref erenzsequenz ausgewahlt, 
die in einer zu analysierenden NSK untersucht werden. Zu 
diesen Posit ionen werden entsprechend unterschiedliche, 
sequenzspezif ische Primer bereitgestellt . Diese Primer konnen 
einen standardisierten Primersatz zur SNP-Analyse bei einer 
bestimmten Fragestellung bilden und einheitlich als Kit fur 
die betreffende Analysen eingesetzt werden. 

Die Vorbereitung des zu analysierenden Materials (auf SNP zu 
untersuchende einzel- und doppelstrangige Nukleinsaureketten) 
hat erfindungsgemafi das Ziel, aus einer oder mehreren langen 
Nukleinsaureketten (Gesamtsequenz) eine Population an relativ 
kleinen, zwischen 30 und 2000 NT langen, einzelstrangigen 
Nukleinsaurekettenfragmenten (NSKFs) zu bilden. 

Diese NSKF-Molekule werden zufallig auf einer planen 
Oberflache mit einer Dichte zwischen 10 und 1.000.000 pro 100 
M m 2 , vorzugsweise 10 und 100 NSKFs pro 100 jam 2 , 100 bis 10.000 
pro 100 /xm 2 oder 10.000 bis 1.000.000 pro lOOjim 2 immobilisiert . 
An die auf der Oberflache gebundenen NSKFs werden Primer 
hybridisiert, so dass die Dichte der extensionsf ahigen NSKF- 
Primer-Komplexe ca. 10-100 pro lOO^im 2 betragt. Nach der 
Hybridisierung werden nicht gebundene Primer entfernt und die 
Sequenzierungsreaktion gestartet . 



Durch eine Auswahl der Zielsequenzen und 
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sequenzspezif ischen Primer werden nur die relevanten 
Abschnitte der Gesamtsequenz untersucht, was die Menge nicht 
relevanter Inf ormationen verringert und die Analysezeit 
verkurzt . 

Dieser Ausfuhrungsf orm des Verfahrens zur SNP-Analyse liegen 
folgende Prinzipien zugrunde: 

Es werden Stellen in einer Ref erenzsequenz ausgewahlt, 
die in den zu untersuchenden NSKs (Gesamtsequenz) auf 
Einzelnukleotidpolymorphismen (SNPs) iiberpruft werden 
sollen. 

1) Zur Analyse jeder ausgewahlten SNP-Stelle werden 
spezifische Primer bereitgestellt , so dass jede zu 
untersuchende SNP-Stelle entweder die nachste Position 
in 3^-Richtung vom Primer einnimmt oder innerhalb von 2 
bis 100, vorzugsweise 2 bis 50, idealerweise 2 bis 20 
Positionen in 3g-Richtung vom Primer liegt. Die SNP- 
Stelle liegt somit innerhalb der Zielsequenz, die 
wahrend der Sequenzierungsreaktion bestimmt wird. Es 
werden vorzugsweise mehrere SNP-Stellen gleichzeitig 
analysiert, so dass mehrere spezifische Primer verwendet 
werden mussen. Die Primer werden vorzugsweise so 
ausgewahlt, dass sie moglichst einheitliche Annealing - 
Temperaturen haben, d.h. Unterschiede zwischen 
Schmelztemperaturen einzelner Primerpopulationen liegen 
beispielsweise innerhalb eines Bereichs von ca. 4 Grad, 
besser innerhalb von 2 Grad, noch besser innerhalb von 1 
Grad. 

2) Von der Gesamtsequenz werden kurze 
Nukleinsaurekettenfragmente (NSKFs) abgeleitet, wobei 
diese Fragmente einzelstrangig sind und eine Lange von 
20 bis 2000 NT, vorzugsweise 30 bis 500 NT besitzen. 

3) NSKF-Molekule werden in einer zufalligen Anordnung auf 
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der Oberf lache immobilisiert . 

4) Nach der Hybridisierung (Annealing) von 
sequenzspezif ischen Primern an die auf der Oberf lache 
immobilisierten NSKFs wird eine zyklische 
Sequenzierungsreaktion durchgefuhrt , wobei fur jedes an 
der Reaktion beteiligte NSKF-Molekiil eine Zielsequenz 
ermittelt wird. Die Sequenzierungsreaktion lSuft an 
vielen Molekiilen gleichzeitig ab. 

5) Die ermittelten Zielsequenzen enthalten Information liber 
die Zugehorigkeit zu einem bestimmten Abschnitt in der 
Gesamtsequenz und uber den SNP in diesem Abschnitt bei 
der zu untersuchenden Probe. Die Lange der Zielsequenzen 
und somit die Zahl der Zyklen ist so zu wahlen, dass 
eine Identif izierung der Sequenzen gewahrleistet werden 
kann . 

In einer vorteilhaf ten Ausf uhrungs form werden die 
ermittelten Zielsequenzen mit der Ref erenzsequenz 
verglichen und durch Sequenzubereinstimmung zugeordnet . 
Bei einer genugend langen ermittelten Zielsequenz kann 
man sie mit grower Wahrscheinlichkeit zu einer 
bestimmten Position in der Ref erenzsequenz zuordnen. 
Beispielsweise kann eine Sequenz aus 10 NTs mehr als 10* 
verschiedene Kombinationen bilden und somit mit einer 
groSen Wahrscheinlichkeit in einer NSK von nur 100.000 
NT eindeutig identif iziert werden. Nach der Zuordnung 
der ermittelten Zielsequenz zur bestimmten Position 
innerhalb der Ref erenzsequenz werden Unterschiede in den 
Sequenzen, die SNPs, sichtbar. 

Zur Identif izierung der Zielsequenzen wird in einer 
anderen vorteilhaf ten Ausf uhrungsf orm sowohl die bereits 
bekannte Anzahl der Primer, ihre Zusammensetzung und ein 
bereits bekannter, an die Primerbindungsstelle 
anschliefcender Sequenzabschnitt der Ref erenzsequenz 
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verwendet. Dabei werden die ermittelten Zielsequenzen 
\iach ihrer Zugehorigkeit zu den Primern analysiert, 
wobei nur die nah an der Primerbindungsstelle liegenden 
Sequenzen berucksichtigt werden miissen. Wenn 
beispielsweise nur 1000 Primer verwendet werden, reichen 
weniger als 10 NTs der ermittelten Zielsequenzen, urn 
eine Zuordnung zu den entsprechenden Primern zu 
ermoglichen . 

Die zu analysierende Probe enthalt meistens mehrere 
identische Gesamtsequenzmolekule, z.B. mehrere Kopien von 
genomischer DNA aus Zellen eines Gewebes oder mehrere 
identische mRNA-Populationen aus Zellen eines Gewebes. 

a) Wahl der SNP-Stelle 

Mit der erf indungsgemaSen Methode kann man sowohl bekannte 
SNP-Stellen analysieren als auch neue SNP-Stellen ermitteln. 
Als potentielle SNP-Stelle kann jede Position in der NSK 
auftreten. Die Auswahl richtet sich nach der Fragestellung, 
z.B. SNP-Analyse in Genen, deren Produkte mit bestimmten 
Krankheiten assoziiert sind, oder SNP-Analyse in 
konservierten, kodierenden Abschnitten der Gene, die fur 
Membranrezeptoren kodieren, oder Uberpriifung bekannter SNP- 
Stellen in regulatorischen Sequenzen von Genen, die fur die 
Zellteilung wichtig sind. 

Eine zu analysierende SNP-Stelle liegt innerhalb einer 
Zielsequenz, die wahrend der Sequenzierungsreaktion bestimmt 
wird. Man kann mehrere SNP-Stellen innerhalb einer Zielsequenz 
ermitteln. Man kann andererseits auch mehrere Zielsequenzen 
z.B. innerhalb eines Gens wahlen. Wichtig dabei ist, dass die 
Zielsequenzen in genugendem Abstand voneinander in der 
Gesamtsequenz liegen. Dieser Abstand ist notwendig, damit nur 
ein sequenzspezifischer Primer pro NSKF hybridisiert , und er 
ist von der durchschnittlichen NSKF-Lange abhangig: je kurzer 
die NSKFs, desto naher aneinander konnen Zielsequenzen liegen. 
Die SNP-Stellen konnen bei angemessener Primer-Wahl an beiden 
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Strangen einer doppelstrangigen Nukleinsaurekette analysiert 
werden . 

Das Verfahren bietet auch die Moglichkeit , beispielsweise 
mehrere SNP-Stellen aus vielen Individuen (als Stichprobe 
einer Population) gleichzeitig zu kontrollieren . Dadurch kann 
z.B. das SNP-Profil einer Population untersucht werden. 

b) Primer fur die Sequenzierungsreaktion 

Sequenzierungsreaktion an einem einzelnen NSKF-Molekiil wird 
durch ein Primer-Molekiil ermoglicht . Ein sequenzspezif ischer 
Primer ist erf indungsgemaS notwendig, urn die 
Sequenzierungsreaktion jeweils an einer bestimmten / 
spezifischen Zielsequenz innerhalb der Gesamtsequenz 
durchfuhren zu konnen. Der fur die Analyse einer SNP-Stelle, 
bzw. einer Zielsequenz einzusetzende sequenzspezif ische 
Primer stellt eine Population von Primer-Molekulen mit 
identischer Struktur dar. Fur die Analyse mehrerer, 
unterschiedlicher Zielsequenzen sind mehrere unterschiedliche 
Primer- Populationen notwendig. 

Durch die Verwendung sequenzspezif ischer Primer werden nur 
die relevanten Sequenzabschnitte, die Zielsequenzen, 
analysiert. Im erf indungsgemafcen Verfahren wird die zu 
sequenzierende Lange der Sequenzen moglichst niedrig 
gehalten, damit die Geschwindigkeit der Analyse steigt. 

Ein sequenzspezif ischer Primer bindet an eine fur ihn 
spezifische Primerbindungsstelle in der zu analysierenden 
Sequenz, PBS. Die Zusammensetzung und die Lange der Primer 
werden fur jede potentielle SNP-Stelle, bzw. Zielsequenz, 
optimiert. Beispiele fur Optimierungsschritte sind in Rychlik 
et al. NAR 1990 v. 18 S.6409 dargestellt. Bei der Primerwahl 
bzw. bei der Wahl der PBS (Primerbindungsstelle) sind 
folgende Aspekte besonders zu berucksichtigen : 

1) Die zu analysierende SNP-Stelle sollte entweder gleich 
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nach dem 3 r -Ende des Primers oder innerhalb der nachsten 2 
bis 50 NTs , vorzugsweise 2 bis 20 NTs liegen . 

2) Die Positionierung (die Wahl der Sequenzlange und der 
Zusammensetzung) der PBS zu SNP-Stelle sollte so erfolgen, 
dass die verschiedenen PBS-Sequenzen und die 
korrespondierenden Primer- Sequenzen moglichst ahnliche 
$Annealing-Temperaturen$ besitzen, urn bei moglichst 
einheitlichen Hybridisierungsbedingungen zu binden. Das 
kann beispielsweise durch Veranderung der PBS-Position im 
Bezug auf die jeweilige, zu analysierende SNP-Stelle oder 
durch die Veranderung der Primersequenzlange erfolgen 
(Rychlik et al. NAR 1990 v. 18 S.6409) . 

3) Der minimale Abstand zwischen Primern, die an denselben 
Strang in der Gesamtsequenz binden, sollte die 
durchschnittliche NSKF-Lange nicht unterschreiten . 

Es konnen Primer fur beide Strange einer Doppelstrang-NSK 
verwendet werden. Damit lassen sich beispielsweise nah 
aneinander liegende SNP-Stellen erfassen, oder man kann eine 
Kontrolle einer SNP-Stelle in beiden Strangen vornehmen. 

Vorzugsweise betragt die Lange des Primers zwischen 6 und 100 
NTs, optimalerweise zwischen 10-30 oder 30-40 oder 40-50. 
Fur verschiedene SNP-Stellen, bzw. Zielsequenzen konnen 
Primer mit unterschiedlicher Lange eingesetzt werden. 

Fur die SNP-Analyse mit sequenzspezif ischen Primern werden 
Primer erf indungsgemafc in einer Hybridisierungslosung an die 
auf der Reaktionsoberf lache immobilisierten NSKFs 
hybridisiert (Annealing-Reaktion) . 

c) Immobilisierung von NSKFs 

In dieser Ausfuhrungform werden erf indungsgemaS die NSKF- 
Primer-Komplexe ausschlieElich liber die NSKFs an die 
Oberf lache gebunden (direkte Bindung von NSKFs an die 
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Oberf lache) , wobei die bereitgestellten NSKF-Molekule an die 
plane Oberf lache in zufalliger Anordnung gebunden werden. 

Die Immobilisierung der NSKFs erfolgt vorzugsweise an einem 
der beiden Ketten-Enden (s.o.). Die Immobilisierung kann auch 
durch eine unspezif ische Bindung, wie z.B. durch Austrocknung 
der NSKFs enthaltenden Probe auf der planen Oberflache 
erreicht werden. Die Dichte der Immobilisation kann zwischen 
10 und 100, 100 und 10.000, 10.000 und 1.000.000 NSKFs pro 
100 fim 2 liegen. 

d) Hybridi sierung 

Die gebundenen NSKFs und die Primer werden unter stringenten 
Hybridisierungsbedingungen inkubiert, die eine moglichst 
selektive Anbindung (Annealing) der Primer an die 
entsprechenden Primerbindungsstellen der NSKFs erlauben. 
Optimale Hybridisierungsbedingungen hangen von der genauen 
Struktur der Primerbindungsstellen und der jeweiligen 
Primerstrukturen ab und lassen sich beispielsweise nach 
Rychlik et al . NAR 1990 v. 18 S.6409 berechnen. 

Die Primer stellen vorzugsweise ein Primergemisch dar. Die 
Konzentrationen einzelner sequenzspezif ischer Primer 
(Einzelkonzentrationen von Primer-Populationen) liegen 
beispielsweise zwischen I0pmol/1 und lmmol/1, vorzugsweise 
zwischen O.lfimol/l und lO/xmol/l. Die Gesamtkonzentration von 
Primern im Primergemisch liegt vorzugsweise zwischen lnmol/1 
und 10mmol/l. Das Verhaltnis zwischen einzelnen Primer- 
Populationen kann variieren. Primer konnen in deutlichem 
Uberschuss fiber die immobilisierten NSKFs zugegeben werden, so 
dass die Hybridisierungszeit gering ist. 

Die fur die Detektion notwendige Dichte von extensionsf ahigen 
NSKF-Primer-Komplexen betragt ca. 10 bis 100 pro 100 /zm 2 . Sie 
kann vor, wahrend oder nach der Hybridisierung der Primer 
erreicht werden. 
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Bei einer bekannten NSKF-Konzentration konnen in einer 
Ausf uhrungsform die Immobilisierungsbedingungen so gewahlt 
werden, dass die NSKFs in einer Dichte von ca. 10 bis 1000 
Molekule pro 100/xm 2 gebunden werden. . NSKFs bestimmen somit 
die Dichte der NSKF-Primer-Komplexe . 

In einer anderen Ausf uhrungsform kann die Dichte der 
immobilisierten NSKFs wesentlich hoher als 1000 NSKFs pro 
lOO^m 2 liegen, z.B. 1.000.000 pro 100/im 2 . Die fur die optische 
Detektion notwendige Dichte der NSKF-Primer-Komplexe wird 
wahrend der Primer-Hybridisierung erreicht. Dabei sind die 
Hybridisierungsbedingungen (z.B. Temperatur, Zeit, Puffer) so 
zu wahlen, dass die Primer nur an einen Teil der 
immobilisierten NSKFs binden. 

Bei unbekannter NSKF-Konzentration und entsprechend 
unbekannter Immobilisationsdichte kann die Hybridisierung 
(Annealing) von Primern an die NSKFs zu einer hoheren als 
optimale Dichte von NSKF- Primer- Komplexen fuhren. 

Aus diesem Grund wird in einer vorteilhaf ten Ausf uhrungs form 
ein Teil der NSKFs enthaltenden Probe fur die Ermittlung der 
optimalen Dichte verwendet . Dieser Teil wird auf einer 
Reaktionsoberf lache immobilisiert , die Primer werden an die 
NSKFs hybridisiert und die entstandenen NSKF-Primer-Komplexe 
werden durch den Einbau von Fluoreszenzf arbstof f tragenden 
NT*s (z.B. Cy3-dCTP, Amersham Pharmacia Biotech) markiert. 
Aus der ermittelten Dichte lasst sich einerseits die 
eventuell notwendige Verdiinnung oder Konzentrierung der 
ursprunglichen Probe fur den endgultigen Sequenzierungsansatz 
errechnen (Die Hybridisierungsbedingungen werden 

beibehalten) . Andererseits konnen daraus notwendige 
Veranderungen in den Hybridisierungsbedingungen errechnet 
werden, beispielsweise eine Verkurzung der 

Hybridisierungszeit , wobei die NSKF-Immobilisierungsdichte 
konstant bleibt. 
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Das Mengen-Verhaltnis zwischen Primerpopulationen kann 
unterschiedlich Oder gleich grofc sein. Durch eine hohere 
Primerkonzentrationen konnen gewisse, beispielsweise 
seltenere Sequenzen mit groSerer Wahrscheinlichkeit in einem 
bestimmten Zeitraum gebunden werden. 

Der grofie Vorteil der beschriebenen Verf ahrensanordnung 
gegeniiber einer Verf ahrensanordnung mit auf einer Oberflache 
immobilisierten seguenzspezif ischen Primern und einer 
anschlieEenden Hybridisierung von Proben an diese Primer ist 
die deutliche Verkurzung der Zeit fur die Hybridisierung 
(Annealing) zwischen den seguenzspezif ischen Primern und den 
zu analysierenden Proben auf der Reaktionsoberf lache . 

Legenden zu Figuren 1 bis 8 
Legende zu Fig. 1 

Schematische Darstellung der Sequenzierng einer langen 
Nukleinsaurekette 

Der Sequenzierung und der Rekonstruktion von langen 
Nukleinsauresequenzen (NSKs) liegt das Shotgun- Prinzip 
zugrunde. Die Sequenz eines langen DNA-Stiicks wird dabei durch 
die Sequenzierung kleiner Fragmente (NSKFs) und eine 
nachfolgende Rekonstruktion ermittelt . 

1) Ausgangsmaterial - die zu analysierende lange 
Nukleinsaurensequenz , Gesamtsequenz 

2) Fragmente von 50-1000 bp - die im Fragmentierungsschritt 
aus der Gesamtsequenz erzeugten NSKFs 

3) Fragmente mit jeweils einem Primer - NSKF- Primer -Komplexe 

4) Immobilisierte Fragmente - an die plane Oberflache 
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gebundene NSKF-Primer-Komplexe, in dieser Ausfiihrungsform 
erfolgt die Bindung am 3"-Ende der NSKFs 

5) Zugabe einer Losung mit Polymerasen und NT*s - der erste 
Schritt in einem Zyklus der Sequenzierungsreaktion 

6) Waschschritt - nach dem Einbauschritt wird die Oberflache 
gewaschen 

7) Detektion - die Signale von einzelnen eingebauten NT*s 
werden detektiert 

8) Entfernung der Markiemng und der zur Termination fuhrenden 
Gruppe 



Legende zur Fig. 2 

Beispiele fur allgemeine Struktur von NSKF-Primer-Komplexen 

In dieser Ausfuhrungsf orm wird eine einheitliche 
Primerbindungsstelle (PBS) an das 3'-Ende der NSKFs 
angekoppelt und an diese PBS bindet ein einheitlicher Primer. 



Legende zur Fig. 3 

Ein Beispiel fur die Ankopplung einer einheitlichen 
Primerbindungsstelle (PBS) , die eine funktionelle Gruppe zur 
Bindung an die Oberflache tragt. 

In diesem Fall wird ein doppelstrangiger 

Oligonukleotidkomplex (3a) , der beispielsweise eine 
Modifikation an beiden Strangen hat (3b), an die 
doppelstrangigen NSKFs liegiert (3c) . Nach Denaturierung 
entstehen einzelstrangige NSKFs mit einheitlicher PBS (3d) • 
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Legende zur Fig. 4 

Ein anderes Beispiel fur die Erzeugung einer einheitlichen 
Primerbindungss telle (PBS) • 

In diesem Fall werden NTs an das 3'-Ende der einzelstrangigen 
NSKFs angekoppelt (ein so genanntes „Tailing u ) . Durch 
Verwendng eines einheitlichen NT entsteht eine einheitliche 
PBS. 



Legende zur Fig. 5 

Beispiel fur die Bindung von NSKFs an eine gelartige 
Reaktionsoberf lache . 

Auf einer festen Unterlage (1) haftet eine Gelschicht (2), 
z.B. ein Polyacrylamidgel (Fig. 5a), oder haften viele 
Gelkugelchen (5), z.B. Agarosekugelchen (Fig. 5b). An die 
Oberf lache des Gels sind NSKFs (4) gebunden. Die NSKFs tragen 
eine funktionelle Gruppe, z.B. Biotin, und sind an das Gel 
uber Streptavidin oder Avidin (3) gebunden. 

Legende zur Fig. 6 

Beispiel fur eine Durchflussvorrichtung 

Eine gelartige Reaktionsoberf lache (1) ist auf einer far das 
Anregungs- und Fluoreszenzlicht durchlassige festen Unterlage 
(2) befestigt. Sie bilden zusammen den Deckel der Flow-Cell. 
Die Flussigkeiten in der Flow-Cell konnen kontrolliert 
ausgetauscht werden, wobei die Flow-Cell zusammen mit 
Vorratsbehalter (3), Pumpe (4) und Ventil (5) eine 
Durchflussvorrichtung bilden. Auf der Reaktionsoberf lache 
sind NSKF-Primer-Komplexe gebunden (hier nicht abgebildet) . 
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Die Signale der eingebauten NT*s werden mit der 
Detektionsapparatur (6) detektiert. 



Legende zur Fig. 7 

Schematische Darstellung der Analyse von mRNA- Population 

Der Analyse liegt die Sequenzierung kurzer Abschnitte von mRNA 
zugrunde . 

1) mRNA - die zu analysierende mRNA- Population, in diesem 
Beispiel bestehend aus zwei unterschiedlichen mRNA- 
Molekiilpopulationen (diinne und dicke Streifen reprasentieren 
mRNA-Molekule) 

2) Immobilisierte mRNA - an die plane Oberflache gebundene 
mRNA-Primer-Komplexe, in diesem Beispiel erfolgt die Bindung 
durch die 01 igo-dT- Primer 

3) Zugabe einer Losung mit Polymerasen und NT*s - der erste 
Schritt in einem Zyklus der Sequenzierungsreaktion 

4) Waschschritt - nach dem Einbauschritt wird die Oberflache 
gewaschen 

5) Detektion - die Signale von einzelnen eingebauten NT*s 
werden detektiert 

6) Entfernung der Markierung und der zur Termination 
fiihrenden Gruppe 

Legende zur Fig. 8 

Beispiel fur ein Detektions system 



Dargestellt ist ein Weitf eld-Optik-Detektionssystem. Nach deir 
Einbau von markierten NT*s wird die Oberflache (7) 
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abgescannt, wobei die Fluoreszenzsignale von einzelnen, an 
die NTs gekoppelten Farbstof fmolekulen detektiert werden. 

Fig. 8a Schematische Darstellung eines Abschnittes der 
Reaktionsoberflache (grau) , der abgescannt wird. Die Kreise 
entsprechen jeweils der Aufnahme eines 2D-Bildes und 
reprasentieren die Flachen, von denen die Fluoreszenzsignale 
detektiert werden. Dabei werden pro Aufnahme mehrere Signale 
(beispielsweise 100 bis 10.000} von einzelnen Molekulen 
gleichzeitig registriert. Die Reaktionsoberflache wird in 
jedem Zyklus abgescannt, wobei wahrend des Scannvorganges 
mehrere Aufnahmen von unterschiedlichen Stellen der 
Oberflache gemacht werden. Dabei kSnnen bis zu mehreren 
Millionen Signale von eingebauten NT*s aufgenommen werden. 
Die hohe Parallelitat ist die Grundlage fur die 
Geschwindigkeit des Verf ahrens . 

Fig. 8b Eine Aufnahme (ein 2D-Bild) mit Signalen von 
einzelnen, eingebauten NT*s. 

Fig. 8c Ausschnitt aus Abbildung 8b. Der Ausschnitt zeigt 
Signale von vier eingebauten NT*s. Jedes Signal besitzt 
charakteristische Eigenschaf ten der Einzelmolekulsignale (s. 
Beschreibung) und kann auf grund dieser identif iziert werden 
(vorzugsweise mit Hilfe eines Computer-Programms) . Jedem der 
identif izierten Signale werden die entsprechenden X,Y- 
Koordinaten zugeordnet . 
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Patentansprtiche ; 

1. Verfahren zur parallelen Sequenzanalyse von 
Nukleinsauresequenzen (Nukleinsaureketten, NSKs) , bei dem 
man 

Fragmente (NSKFs) einzelstrangiger NSKs mit einer Lange 
von etwa 50 bis 1000 Nukleotiden erzeugt, die uberlappende 
Teilsequenzen einer Gesamtsequenz darstellen kdnnen, man 

die NSKFs unter Verwendung eines einhe it lichen oder 
mehrerer unterschiedlichen Primer in Form von NSKF-Primer- 
Komplexen auf einer Reaktionsoberf lache in einer 
zufalligen Anordnung bindet, man 

eine zyklische Aufbaureaktion des komplementaren Stranges 
der NSKFs unter Verwendung einer oder mehrerer Polymerasen 
durchfuhrt, indem man 

a) zu den auf der Oberflache gebundenen NSKF-Primer- 
Komplexen eine Losung zugibt, die eine oder mehrere 
Polymerasen und ein bis vier modifizierte Nukleotide 
(NTs*) enthalt, die mit Fluoreszenzf arbstof f en 
markiert sind, wobei die bei gleichzeitiger 
Verwendung von mindestens zwei NTs* jeweils an den 
NTs* befindlichen Fluoreszenzf arbstof fe so gewahlt 
sind, dass sich die verwendeten NTs* durch Messung 
unterschiedlicher Fluoreszenzsignale voneinander 
unterscheiden lassen, wobei die NTs* an der 3»- 
Position strukturell so modifiziert sind, daS die 
Polymerase nach Einbau eines solchen NT* in einen 
wachsenden komplementaren Strang nicht in der Lage 
ist, ein weiteres NT* in denselben Strang ein- 
zubauen, wobei der zur Termination fiihrende 
Substituent und der Fluoreszenzf arbstof f abspaltbar 
ist, man 
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b) die in Stufe a) erhaltene stationare Phase unter 
Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strange geeignet sind, wobei die 
komplementaren Strange jeweils urn ein NT* verlangert 
werden, man 

c) die in Stufe b) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung nicht in einen 
komplementaren Strang eingebauter NTs* geeignet sind, 
man 

d) die einzelnen, in komplementare Strange eingebauten 
NTs* durch Messen des fur den jeweiligen Fluo- 
reszenzf arbstoff charakteristischen Signals detek- 
tiert, wobei man gleichzeitig die relative Position 
der einzelnen Fluoreszenzsignale auf der Reaktions- 
oberflache bestimmt, man 

e) zur Erzeugung unmarkierter (NTs oder) NSKFs die zur 
Termination fuhrenden Substituenten und die 
Fluoreszenzf arbstoff e von den am komplementaren 
Strang angefiigten NTs* abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung der Fluo- 
reszenzf arbstoff e und der Liganden geeignet sind, man 

die Stufen a) bis f) gegebenenf alls mehrfach wiederholt, 

wobei man die relative Position einzelner NSKF-Primer- 
Komplexe auf der Reaktionsoberf lache und die Sequenz 
dieser NSKFs durch spezifische Zuordnung der in Stufe d) 
in aufeinanderfolgenden Zyklen an den jeweiligen 
Positionen detektierten Fluoreszenzsignale zu den NTs be- 
stimmt . 
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2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , dass 
man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in jedem Zyklus nur jeweils 
ein markiertes NT* einsetzt. 

3. Verfahren nach Anspruch 1, dadurch gekennzeichnet , dass 
man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in jedem Zyklus jeweils 
zwei unterschiedlich markierte NTs* einsetzt. 

4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass 
man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in jedem Zyklus jeweils 
vier unterschiedlich markierte NTs* einsetzt. 

5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass 
die NSKs Varianten einer bekannten Ref erenzsequenz sind 
und man die Stufen a) bis f ) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in den Zyklen abwechselnd 
jeweils zwei unterschiedlich markierte NTs* und zwei 
unmarkierte NTs einsetzt und man die Gesamtsequenzen durch 
Vergleich mit der Ref erenzsequenz ermittelt. 

6. Verfahren nach den Anspruchen 1 bis 5, dadurch gekenn- 
zeichnet, dass man in die NSKFs jeweils eine Primerbin- 
dungsstelle (PBS) einfiihrt, wobei man bei doppelstrangigen 
NSKs an beiden komplementaren Einzelstrangen jeweils eine 
PBS einfiihrt und wobei die Primerbindungsstellen fur alle 
NSKFs jeweils gleiche oder verschiedene Sequenzen 
aufweisen. 

7. Verfahren nach den Anspruchen 1 bis 6, dadurch gekenn- 
zeichnet, dass man die NSKFs mit Primern in einer Losung 
unter Bedingungen in Kontakt bringt, die zur Hybridisie- 
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rung der Primer an .die Primerbindungsstellen (PBSs) der 
NSKFs geeignet sind, wobei die Primer untereinander 
gleiche oder verschiedene Sequenzen aufweisen, und man die 
gebildeten NSKF-Primer-Komplexe anschlieSend auf der Reak- 
tionsoberf lache bindet. 

8. Verfahren nach den Anspriichen 1 bis 6, dadurch gekenn- 
zeichnet, dass man die NSKFs zunachst auf der Reaktions- 

' oberf lache immobilisiert und erst anschlieSend mit Primern 
unter Bedingungen in Kontakt bringt, die zur Hybridisie- 
rung der Primer an die Primerbindungsstellen (PBSs) der 
NSKFs geeignet sind, wobei NSKF-Primer-Komplexe gebildet 
werden, wobei die Primer untereinander gleiche oder ver- 
schiedene Sequenzen aufweisen. 

9. Verfahren nach den Anspriichen 1 bis 6, dadurch gekenn- 
zeichnet, dass man die Primer zunachst auf der 
Reaktionsoberf lache immobilisiert und erst anschliefiend 
mit NSKFs unter Bedingungen in Kontakt bringt, die zur 
Hybridisierung der Primer an die Primerbindungsstellen 
(PBSs) der NSKFs geeignet sind, wodurch NSKFs an die 
Obeirflache gebunden und NSKF-Primer-Komplexe gebildet 
werden, wobei die Primer untereinander gleiche oder 
verschiedene Sequenzen aufweisen. 

10. Verfahren nach den Anspriichen 1 bis 9, dadurch 
gekennzeichnet , dass die Dichte der extensionsf ahigen 
NSKF-Primer-Komplexe zwischen etwa 10 und 100 pro 100/zm 2 
liegt . 



11. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass 
die Nukleinsauresequenzen (NSKs) Sequenzabschnitte einer 
Gesamtsequenz sind und die Primer sequenzspezif ische 
Primer sind, wobei man 
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einzelstrangige NSKFs mit einer Lange von etwa 30 bis 
1000 Nukleotiden bereitstellt, die iiberlappenden 
Teilsequenzen der Gesamtsequenz entsprechen, man 

die NSKF-Molekiile direkt an einer planen Oberflache in 
einer zufalligen Anordnung bindet, man 

mit einer oder mehreren sequenzspezif ischen 
Primerpopulationen eine Hybridisierung (Annealing) an die 
immobilisierten NSKFs durchfuhrt, wobei die Dichte der 
einzelnen extensionsf ahigen NSKF-Primer-Komplexe zwischen 
10 und 100 pro 100/zm 2 liegt, man 

eine zyklische Auf baureaktion der zu NSKFs komplementaren 
Strange durchfuhrt, indem man 

a) zu den gebundenen NSKF-Primer-Komplexen eine Losung 
zugibt, die eine oder mehrere Polymerasen und ein bis 
vier modif izierte Nukleotide (NTs*) enthalt, die mit 
Fluoreszenzfarbstof fen markiert sind, wobei die bei 
gleichzeitiger Verwendung von mindestens zwei NTs* 
jeweils an den NTs* befindlichen Fluoreszenzf arb- 
stoffe so gewahlt sind, da£ sich die verwendeten NTs* 
durch Messung unterschiedlicher Fluoreszenzsignale 
voneinander unterscheiden lassen, wobei die NTs* an 
der 3 1 -Position strukturell so modif iziert sind, daS 
die Polymerase nach Einbau eines solchen NT" in einen 
wachsenden komplementaren Strang nicht in der Lage 
ist, ein weiteres NT* in denselben Strang einzubauen, 
wobei der zur Termination fiihrende Substituent und 
der Fluoreszenzfarbstof f abspaltbar ist, man 

b) die in Stufe a) erhaltene stationare Phase unter 
Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strange geeignet sind, wobei die 
komplementaren Strange jeweils urn ein NT* verlangert 
werden, man 
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c) die in Stufe b) erhaltenen stationaren Phase unter 
Bedingungen wascht, die zur Entfernung nicht in einen 
komplementaren Strang eingebauter NTs* geeignet sind, 
man 

e) die einzelnen, in komplementare Strange eingebauten 
NT*-Molekule durch Messen des fur den jeweiligen 
Fluoreszenzfarbstof f charakteristischen Signals 
detektiert, wobei man gleichzeitig die relative Posi- 
tion der einzelnen Fluoreszenzsignale auf der 
Reaktionsoberf lache bestimmt, man 

e) die zur Termination fiihrenden Substituenten und -die 
Fluoreszenzf arbstof f e von den am komplementaren 
Strang angefiigten NTs* zur Erzeugung unmarkierter 
(NTs oder) NSKFs abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung der zu 
Termination fiihrenden Gruppen mit den Fluoreszenz- 
farbstoffen geeignet sind, man 

die Stufen a) bis f) gegebenenf alls mehrfach wiederholt, 

wobei man die relative Position einzelner NSKF-Primer- 
Komplexe auf der Reaktionsoberf lache und die Sequenz 
dieser NSKFs durch spezifische Zuordnung der in Stufe d) 
in aufeinanderfolgenden Zyklen an den jeweiligen 
Positionen detektierten Fluoreszenzsignale zu den NTs 
bestimmt . 



Verfahren zur hoch parallelen Analyse der Genexpression 
bei dem man 
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einzelstrangige Genprodukte bereitstellt , man 

die Genprodukte unter Verwendung eines einheitlichen oder 
mehrerer unterschiedlichen Primer in Form von Genprodukt- 
Primer-Komplexen auf einer Reaktionsoberf lache in einer 
zufalligen Anordnung bindet, man 

eine zyklische Aufbaureaktion des komplementaren Stranges 
der Genprodukte unter Verwendung einer oder mehrerer 
Polymerasen durchfuhrt, indem man 

a) zu den auf der Oberf lache gebundenen Genprodukt- 
Primer-Komplexen eine Losung zugibt, die eine oder 
mehrere Polymerasen und ein bis vier modifizierte 
Nukleotide (NTs*) enthalt, die mit Fluoreszenzf arb- 
stoffen markiert sind, wobei die bei gleichzeitiger 
Verwendung von mindestens zwei NTs* jeweils an den 
NTs* befindlichen Fluoreszenzf arbstoffe so gewahlt 
sind, dass sich die verwendeten NTs* durch Messung 
unterschiedlicher Fluoreszenzsignale voneinander 
unterscheiden lassen, wobei die NTs* an der 3'- 
Position strukturell so modifiziert sind, da£ die 
Polymerase nach Einbau eines solchen NT* in einen 
wachsenden komplementaren Strang nicht in der Lage 
ist, ein weiteres NT* in* denselben Strang ein- 
zubauen, wobei der zur Termination fuhrende 
Substituent und der Fluoreszenzf arbstoff abspaltbar 
ist, man 

b) die in Stufe a) erhaltene stationare Phase unter 
Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strange geeignet sind, wobei die kom- 
plementaren Strange jeweils urn ein NT* verlangert 
werden, man 

c) die in Stufe b) erhaltene stationare Phase unter 
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Bedingungen wascht, die zur Entfemung nicht in 
einen komplementaren Strang eingebauter NTs* ge- 
eignet sind, man 

d) die einzelnen, in komplementare Strange eingebauten 
NTs* durch Messen des fur den jeweiligen Fluo- 
reszenzfarbstoff charakteristischen Signals detek- 
tiert, wobei man gleichzeitig die relative Position 
der einzelnen Fluoreszenzsignale auf der Reaktions- 
oberflache bestimmt, man 

e) zur Erzeugung unmarkierter, (NTs oder) Genprodukte 
die zur Termination fuhrenden Substituenten und die 
Fluoreszenzf arbstof f e von den am komplementaren 
Strang angefugten NTs* abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfemung der Fluores- 
zenzf arbstof fe und der Liganden geeignet sind, man 

die Stufen a) bis f) gegebenenf alls mehrfach wiederholt, 

wobei man die relative Position einzelner Genprodukt- 
Primer-Komplexe auf der Reaktionsoberf lache und die 
Sequenz dieser Genprodukte durch spezifische Zuordnung 
der in Stufe d) in auf einanderf olgenden Zyklen an den 
jeweiligen Positionen detektierten Fluoreszenzsignale zu 
den NTs bestimmt und man aus den ermittelten Teilse- 
quenzen die Identitat der Genprodukte bestimmt. 

13. Verfahren nach Anspruch 12, dadurch gekennzeichnet , dass 
man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in jedem Zyklus nur 
jeweils ein markiertes NT* einsetzt. 

14. Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass 
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man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, . wobei man in jedem Zyklus jeweils 
zwei unterschiedlich markierte NTs* einsetzt. 

15. Verfahren nach Anspruch 12, dadurch gekennzeichnet , dass 
man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in jedem Zyklus jeweils 
vier unterschiedlich markierte NTs* einsetzt. 

16. Verfahren nach Anspruch 12, dadurch gekennzeichnet , dass 
bereits bekannte Gene als Ref erenzsequenzen dienen und 
man die Stufen a) bis f) der zyklischen Aufbaureaktion 
mehrfach wiederholt, wobei man in den Zyklen abwechselnd 
jeweils zwei unterschiedlich markierte NTs* und zwei 
unmarkierte NTs einsetzt und man die Identitat der 
Genprodukte durch Vergleich der gewonnenen Sequenzen mit 
denen der Ref erenzsequenzen ermittelt. 

17. Verfahren nach den Anspruchen 12 bis 16, dadurch gekenn- 
zeichnet, dass man in die Genprodukte jeweils eine 
Primerbindungsstelle (PBS) einfuhrt, wobei die Primer- 
bindungsstellen fur alle Genprodukte jeweils gleiche oder 
verschiedene Sequenzen aufweisen. 

18. Verfahren nach den Anspruchen 12 bis 17, dadurch gekenn- 
zeichnet, dass man die Genprodukte mit Primern in einer 
Losung unter Bedingungen in Kontakt bringt, die zur 
Hybridisierung der Primer an die Primerbindungsstellen 
(PBSs) der Genprodukte geeignet sind, wobei die Primer 
untereinander gleiche oder verschiedene Sequenzen 
aufweisen, und man die gebildeten Genprodukt- Primer - 
Komplexe anschliefeend auf der Reaktionsoberf lache bindet. 

19. Verfahren nach den Anspruchen 12 bis 17, dadurch gekenn- 
zeichnet, dass man die Genprodukte zunachst auf der Reak- 
tionsoberf lache immobilisiert und erst anschlieSend mit 
Primern unter Bedingungen in Kontakt bringt, die zur 
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Hybridisierung der Primer an die Primerbindungsstellen 
(PBSs) der Genprodukte geeignet sind, wobei Genprodukt- 
Primer-Komplexe gebildet werden, wobei die Primer 
untereinander gleiche oder verschiedene Sequenzen auf- 
weisen. 

20. Verfahren nach den Anspriichen 12 bis 17, dadurch gekenn- 
zeichnet, dass man die Primer zunachst auf der Reaktions- 
oberflache immobilisiert und erst anschlieSend mit Gen- 
produkten unter Bedingungen in Kontakt bringt, die zur 
Hybridisierung der Primer an die Primerbindungsstellen 
(PBSs) der Genprodukte geeignet sind, wodurch Genprodukte 
an die Oberflache gebunden und Genprodukt- Primer- Komplexe 
gebildet werden, wobei die Primer untereinander gleiche 
oder verschiedene Sequenzen aufweisen. 

21. Verfahren nach den Anspriichen 12 bis 20, dadurch 
gekennzeichnet , dass die Dichte der extensionsf ahigen 
Genprodukt-Primer-Komplexe zwischen etwa 10 und 100 pro 
100/zm 2 liegt. 



22. Verfahren nach Anspriichen 1 bis 21 dadurch gekennzeichnet , 
dass der Fluoreszenzf arbstof f zusammen mit dem zur 
Termination fiihrenden Substituenten abgespalten wird. 

23. Verfahren nach Anspriichen 1 bis 21 dadurch gekennzeichnet, 
dass zunachst der Fluoreszenzf arbstof f abgespalten wird 
und erst danach der zur Termination fuhrende Substituent 
abgespalten wird. 

24. Verfahren nach Anspriichen 1 bis 21, dadurch 
gekennzeichnet, dass man im Detektionsschritt (d) 
folgende Detektionsarten einsetzt: Weitfeld- 
Epif luoreszenzmikroskopie, Laser-Scanning- 
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Fluoreszenzmikroskopie , TIRF-Mikroskopie . 

25. Verfahren nach den Anspruchen 1 oder 11, dadurch 
gekennzeichnet , dass es ein Verfahren zur SNP-Analyse ist 
und man einen sequenzspezif ischen Primer zur 
Identif izierung jeder SNP-Stelle in der Gesamtsequenz 
verwendet . 

26. Verfahren nach Anspruch 25, dadurch gekennzeichnet, dass 
die Zahl der parallel zu analysierenden SNP-Stellen 
grofier als 2 ist und man fur jede SNP-Stelle einen 
sequenzspezif ischen Primer verwendet. 

27. Verfahren nach den Anspruchen 1 bis 26, dadurch gekenn- 
zeichnet, dass die Reaktionsoberf lache aus der Gruppe 
bestehend aus Silicon, Glas, Keramik, Kunststof f en, Gelen 
ausgewahlt ist. 

28. Verfahren nach Anspruch 27, dadurch gekennzeichnet, dass 
die Kunststoffe Polycarbonate oder Polystyrole oder 
Derivate derselben sind. 

29. Verfahren nach Anspruch 27, dadurch gekennzeichnet, dass 
die Gele Agarose- oder Polyacrylamidgele oder Derivate 
derselben sind. 

30. Verfahren nach Anspruch 29, dadurch gekennzeichnet, dass 
die Gele 1 bis 2 % Agarose-Gele oder 10 bis 15 % 
Polyacrylamid-Gele sind. 

31. Verfahren nach den Anspruchen 1 bis 30, dadurch 
gekennzeichnet, dass die Polymerase eine DNA- Polymerase 
ohne 3 1 -5 1 -Exonukleaseaktivitat ist. 

32. Verfahren nach Anspruch 31, dadurch gekennzeichnet, dafi 
die Polymerase aus der Gruppe bestehend aus viralen DNA- 
Polymerasen vom Sequenase-Typ, bakteriellen 
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thermolabilen und thermostabilen DNA-Polymerasen, DNA- 
Polymerasen Beta aus Eukaryonten und Reversen- 
Transkriptasen ausgewahlt ist . 

33. Verfahren nach den Anspruchen 1 bis 32, dadurch 
gekennzeichnet, dass die Fluoreszenzf arbstof f e aus der 
Gruppe bestehend aus Cyanin-Farbstof f en, Rhodamine, 
Xanthene, Porphyrine und deren Derivaten ausgewahlt sind. 

34. Trager zur Durchfuhrung des Verfahrens nach den 
Anspruchen 1 bis 33, dadurch gekennzeichnet, dass auf 
seiner Oberflache die Nukleinsaureketten oder deren 
Fragmente in einer zufalligen Anordnung immobilisiert 
sind, wobei die Dichte der immobilisierten 
Nukleinsaureketten-Molekiile oder deren Fragmente zwischen 
10 und 100 pro 100/im 2 liegt . 

35. Trager zur Durchfuhrung des Verfahrens nach den 
Anspruchen 1 bis 33, dadurch gekennzeichnet, dass auf 
seiner Oberflache die Nukleinsaureketten oder deren 
Fragmente in einer zufalligen Anordnung immobilisiert 
sind, wobei die Dichte der immobilisierten 
Nukleinsaureketten-Molekule oder deren Fragmente zwischen 
100 und 1.000.000 pro 100Mm 2 liegt. 

36. Kit zur Durchfuhrung des Verfahrens nach den Anspruchen 
1 bis 35, dadurch gekennzeichnet, daS es eine 
Reaktionsoberf lache (einen festen Trager) , zur 
Durchfiihrung des Verfahrens erf order liche Reak- 
tionslosungen, ein oder mehrere Polymerasen, und Nu- 
kleotide (NTs) enthalt, von denen ein bis vier mit Fluo- 
reszenzf arbstof fen markiert sind, wobei die markierten 
NTs ferner strukturell so modifiziert sind (NT* bzw. 
NTs*) , dafi die Polymerase nach Einbau eines solchen NT* in 
einen wachsenden komplementaren Strang nicht in der Lage 
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ist, ein weiteres NT* in denselben Strang einzubauen, 
wobei der zur Termination fuhrende Substituent mit dem 
Fluoreszenzf arbstof f abspaltbar ist 

37. Kit nach Anspruch 36, dadurch gekennzeichnet, daS es 
ferner Bestandteile enthalt: 



a) zur Erzeugung von Einzelstrangen aus Doppelstrangen 
erforderliche Reagenzien, 

b) Nukleinsauremolekiile, die als PBS in die NSKFs 
eingef iihrt werden , 

c) Oligonukleotid-Primer, 

d) zur Abspaltung der Substituenten mit den Fluores- 
zenzf arbstof fen erforderliche Reagenzien, 

e) Waschlosungen. 



38. Kit nach den Anspruch 36 oder 37, dadurch 

gekennzeichnet, daS die Reaktionsoberf lache aus der 

Gruppe bestehend aus Silicon, Glas, Keramik, 
Kunststof f en, Gelen ausgewahlt ist. 



39. Kit nach Anspruch 38, dadurch gekennzeichnet , daS die 
Gele Polyacrylamidgele sind. 

40. Kit nach Anspruch 39, dadurch gekennzeichnet, da£ die 
Gele 5 bis 3 0% Polyacrylamid-Gele sind. 



41. Kit nach den Anspriichen 3 6 
net, dafi die DNA- Polymerase 
5 1 -Endonukleaseaktivitat ist 



bis 40, dadurch gekennzeich- 
eine DNA- Polymerase ohne 3 1 - 



42. Kit nach den Anspriichen 36 bis 41, dadurch gekennzeich- 
net, daS die an die Nukleotide gekoppelten 
Fluoreszenzfarbstof fe aus der Gruppe bestehend aus Cya- 
nin-Farbstof fen, Rhodamine, Xanthene, Porphyrine und 
deren Derivaten ausgewahlt sind. 
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1) 



2) 



Fig.l 



Ausgangsmaterial 



Fragmente 50-1000 bp 



3) " - 



Fragmente mit jeweils 
einem Primer 



4) 




Immobilisierte Fragmente 



5) 




Zugabe einer Losung mit 
. Polymerasen und NTs* 



6) 




Waschschritt 



7) 



8) 




Detektion 



Entfernung der Markierung und 
der zur Termination fiihrenden 
Gruppe 



Legende: 

feste Oberflache 



Polymerase NT* Signal von NT* 



o 



Mikroskop und 
Beleuchtung 
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Fig. 2 



AUgemeine Struktur fiir inunobilisierte Nukleinsaurekettenfragmente 



1 • 

5 ^ 3^ 

2 3 



Legende: 

1) Primer 

2) Primerbindungsstelle 

3) einzelstrangiger Teil des Nukleinsaurekettenfragments, stammt vom 
Ausgangsmaterial 



WO 03/020968 PCT/EP02/09614 
- ' 3/9 

Fig. 3 



Otigonukleotid-Konstruktion mit einer Primerbindungsstelle und blockierten 
Enden. 

3a) 

Oligonukleotidkomplex 5" 3 

37/- //5- 

Primerbindungsstelle // II 

3b) 

Modifikation einer Seite des Oligonukleotides an beiden Strangen. Nur ein Ende steht 
fiir die Ligation zur Verfugung. 

xxxxx-5" 3' 

kkk-37/ -//5^ 

Die modifizierenden Gruppen "xxxxx-" und "kkk-" kSnnen z.B. zur Immobilisation 
oder Markierung dienen. 



3c) 

Resultat der Ligation des Oligonukleotides mit den DNA-Fragmenten 

n^.y -/-- //- f-H* 

kkk.3// .//. / 5 -xxxxx 



3d) 

Konstruktion der DNA-Fragmente nach der Denatunerung 

~ , .//. //3^-kkk 

xxxxx-5 / " 
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Fig. 4 

Nukleotid-Tailing 



5 .. _ 3 V einzelstrangiges DNA-Fragment 

+ Deoxynucleotidyltransferase 
+ dGTP 

I 

5* (G)n3 ^ 
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Fig. 5 



5a) 



/ / ////////////////// 



5b> 






777777777777 



Legende: 

1) feste OberflSche 

2) Gel 

3) zur Immobilisation geeignete Gruppen, z.B. Avidin oder Streptavidin, oder 
Oligonukleotide 

4) . NSKFs 

5) Agarosekugelchen 
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Fig. 6 



6 




A 



YZZZZZ2EZZZZZZZZZZZ&ZA 




t 1 ? 



Flussrichtung 



Legende: 

1) Reaktionsoberflache 

2) feste Unterlage 

3) VorratsbehSlter 

4) Pumpe 

5) Ventil 

6) Objektiv des Mikroskops 
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FIG. 7 



mRNA 



2) 




Immobilisierte mRNA 



3) 




Zugabe einer Losung mit 
Polymerasen und NTs* 



4) 



5) 



6) 




Waschschritt 



Detektion 



Entfernung der Markierung und 
der zur Termination fthrenden 
Gruppe 



Legende: 

feste Oberflache Polymerase 
mit oiigo-dT-Primern 




o 



NT* Signal von NT* 



Mikroskop und 
Beleuchtung 
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Fig, 8 



Rechner 




Legende: 

1) Lichtquelle zur Anregung der Fluoreszenz 

2) Lichtleitender Teil 

3) Scanntisch 

4) Vorrichtung zur Selektion von Spektren 

5) „ Detektionsvorrichtung 

6) Computer mit Steuerangs- und Analysefunktionen 

7) Oberflache mit immobilisierten NSKFs 



